电子游戏不朽的情缘,电子游艺cq9游戏怎么玩,pg电子游戏维护需要多久才能完成

傳智教育(股票代碼 003032)旗下高端IT教育品牌

  • 免費教程
  • 原創書籍
  • 教研團隊
  • 開班時間
  • 報名流程
  • 項目信息站
  • 技術社區
北京昌平 
學費是多少? 學多久就業? 能拿多少工資?
申請免費試聽名額
  • 大數據—21世紀的“金礦”
    得數據者得天下

    大數據對全球發展影響重大

  • 大數據戰略強勢布局
    引領企業轉型

    從數據大國邁向數據強國

  • 大數據產業規模
    已超3萬億元

    數據來源:《“十四五”大數據產業發展規劃》

快速了解大數據開發 學完可以做什么?
  1. 人才需求大缺口1400萬+

  2. 就業薪資高均薪18300元/月

  3. 升職加薪快雙重晉升通道

了解大數據就業前景
  • 大數據開發入門1

    Linux 基本命令用戶管理VI權限管理網絡管理SSH

    MySQL DDLDMLDQL多表查詢分組查詢約束

    Kettle 數據轉換腳本組件Job開發

    BI工具 基本操作常用圖表儀表板

    階段案例實戰

    * 傳統數據倉庫實戰
  • 大數據核心基礎2

    ZooKeeper 架構原理存儲模型ZK集群搭建選舉機制

    Hadoop HDFS HDFS架構Block塊存儲讀寫流程NameNodeDataNode高可用集群

    Hadoop MapReduce 核心原理執行流程Shuffle機制

    Hadoop YARN YARN組件架構原理執行流程調度器

    Hive HQL數據類型分區分桶拉鏈表元數據數據壓縮存儲格式原理架構性能優化

  • 千億級數倉技術3

    CDH CM架構組件構建CM實操

    基于阿里數倉分層架構 ODSDIMDWSDWDDMADS

    Hive + Presto 架構原理SQL調優集群構建

    Hive 性能調優 數據傾斜JOIN調優Hive索引

    調度 DSAzkabanOozie

    階段項目實戰

    * 黑馬甄選離線數倉項目 * 黑馬甄選離線數倉項目(實戰)
    能力畫像:掌握數倉建模的理念和實戰,具備離線數倉開發能力
    勝任崗位:數倉開發工程師、ETL工程師、數據治理工程師、數據運維工程師
    參考薪資:8000-12000元
  • 數據分析技術4

    Python編程 基本語法數據結構函數面向對象異常處理模塊與包網絡編程多進程多線程閉包裝飾器迭代器

    數據分析 Jupyter NotebookPandasMatploblibSeaborn

    階段項目實戰

    * 業務數據分析實戰
    能力畫像:掌握Python語言,實戰數據分析項目,具備數據分析工程師能力
    勝任崗位:數據庫分析師、BI報表工程師、數據運營
    參考薪資:7000-12000元
  • PB級內存計算5

    Spark 架構原理Spark RDDSpark DFSpark DAGSpark SQL內存迭代性能調優任務調度Pandas on SparkSpark on HiveSpark ShuffleSpark 3.x 新特性kafka原理和架構設計分布式實時計算架構和思想

    用戶畫像及推薦解決方案 SparkSQL整合ES自定義數據源、用戶畫像標簽構建規則、用戶畫像規則類標簽構建、用戶畫像統計類標簽構建

    階段項目實戰

    * 黑馬甄選用戶畫像及推薦項目
    能力畫像:掌握Structured Streaming等技術,具備離線及實時大數據開發的能力
    勝任崗位:數據平臺工程師、用戶畫像工程師、推薦算法工程師、機器學習工程師
    參考薪資:10000-15000元
  • 亞秒級實時計算6

    阿里云實時計算Flink 架構原理批流一體Window操作State操作DataStreamCheckpointFlink SQL任務調度負載均衡狀態管理Runtime執行計劃Flink性能監控與調優阿里云Flink+Kafka阿里云Flink+Paimon

    階段項目實戰

    * 基于阿里云平臺的泛電商實時大數據平臺
    能力畫像:通過阿里云平臺掌握開發離線和實時數倉項目
    勝任崗位:實時數倉開發工程師、數據治理工程師、實時風控大數據系統
    參考薪資:12000-16000元
  • 大廠面試7

    數據結構 數組鏈表哈希表

    高頻算法 排序查找數組字符串鏈表隊列二叉樹回溯動態規劃貪心復雜度

    面試真題 編程語言SQLHadoop生態HiveSparkFlink

    大廠架構 美團點評數倉架構小米大數據架構平安大數據架構

    根據就業學員面試反饋,整理面試大綱,掌握大廠必備的知識、技能。模擬面試,針對性解決面試問題,提升面試成功率。
免費領取全套教程
  • AI大模型全程賦能

    讓數據分析更精準,開發更高效

  • 1000+核心業務指標

    多行業高效通用

  • 聯合阿里云共建課程

    助力企業“上云”便捷開發

黑馬程序員
AI+Python大數據
課程優勢

  • 真業務真數據 積累真經驗

    13大熱門行業,千億級大數據實戰

  • 真業務真數據 積累真經驗

    開發不必從零開始

  • 課程設置全面

    熱門數據崗位全覆蓋

AI大模型全程賦能,讓數據開發更高效
真業務、真數據,積累真經驗!
1000+核心業務指標,多行業高效通用
前沿解決方案拿來即用,開發不必從零開始
  • 基于StarRocks的
    統一數倉平臺

    核心優勢

    適用于數據分析、離線數倉、實時數倉、用戶畫像、實時風控等應用場景

    全程使用SQL即可完成數倉開發,學習成本低,上手快

    StarRocks查詢性能強悍,高可用,高可靠,運維簡單

  • 流批一體數倉
    解決方案

    核心優勢

    以電商業務為背景,需求涵蓋實時和離線全場景,主題、指標豐富

    基于Flink和Paimon實現流批一體、湖倉一體架構,極大降低開發和運維成本

    從0到1進行數倉規劃和搭建,融入數倉建模和開發流程,快速提高實戰能力

  • 一站式數據治理
    解決方案

    核心優勢

    提供DataWorks云產品和開源組件兩套解決方案,解決不同公司需求

    涵蓋數據質量、數據安全、數據標準、元數據管理等全域數據治理

    基于銀行業務打造,真實還原企業數據治理全流程

  • 阿里云一站式云端
    解決方案

    核心優勢

    以打車業務為背景,真實還原企業業務場景和需求,方便理解與吸收

    實時基于阿里云Flink開發運用Flink CDC/Flink SQL進行編程,兼顧易用性和高效性

    離線基于DataWorks和MaxCompute開發,輕松完成數據集成、數據開發、項目運維等工作

聯合阿里云共建課程,助力企業"上云"便捷開發

黑馬&阿里云 強強聯合 研發阿里云Flink課程該課程是黑馬AI+Python大數據V5.0課程新增重要內容,它基于各類企業近期招聘需求,升級了阿里云平臺全套大數據技術棧內容。并由多位Apache社區貢獻者聯袂授課,采用六項目制驅動技術學習,從原理、實戰到源碼,幫助學生邁入高級開發工程師行列,滿足國家數字化轉型對數字人才的大量需求。

課程設置全面,熱門數據崗位全覆蓋
  • 數據分析

    收集、整理和分析數據,提供數據報告和業務建議

    技術要求:熟練使用數據分析工具,理解業務需求,具備良好的溝通能力

    熱門崗位

    數據庫分析師BI報表工程師數據運營

    課程技術點

    PythonPandasPySparkPython數據分析項目帆軟BI

  • 數據開發

    負責大數據平臺的搭建與維護、數據采集與處理、數倉設計與開發、性能優化等工作

    技術要求:需具備大數據技術棧應用、數據處理、數據庫應用、數倉開發等技能

    熱門崗位

    數據庫開發數倉開發工程師ETL工程師數據平臺工程師數據治理工程師大數據運維工程師

    課程技術點

    Hadoop技術棧Spark技術棧Flink技術棧黑馬甄選項目黑馬出行離線項目實時數倉項目

  • 數據挖掘

    負責利用機器學習算法,從大量數據中提取有價值的信息,并基于此進行分析和預測

    技術要求:數據挖掘工程師需具備Python、數據處理、機器學習等多方面技能

    熱門崗位

    機器學習工程師數據挖掘工程師用戶畫像工程師推薦算法工程師

    課程技術點

    數據治理用戶畫像推薦系統實時風控大數據系統統一數倉系統

AI+Python大數據開發課程大綱

  • 階段一   數據庫基礎

    查看詳細課程大綱課時:8天技術點:60項測驗:1次學習方式:線下面授

    新增AI賦能

    掌握國內主流AI編程大模型工具,通過嵌入DataGrip中完成業務數據分析SQL代碼開發。

    主講內容

    Linux操作系統、MySQL與SQL、Kettle與BI工具、電商運營指標分析

    可掌握的核心能力

    1.掌握MySQL數據庫的使用;
    2.掌握SQL語法;
    3.掌握Kettle數據遷移工具的使用;
    4.熟練使用BI可視化工具;
    5.對數據開發有一定認知,掌握BI工程師所具備的基本技能。

    可解決的現實問題

    熟練掌握MySQL\SQL、Kettle以及BI工具使用,能夠解決傳統數倉業務開發任務。

  • 階段二   Hadoop技術棧

    查看詳細課程大綱課時:13天技術點:8項學習方式:線下面授

    新增AI賦能

    能夠基于AI大模型工具輔助完成基本構建企業級數倉 掌握AI輔助編寫Shell腳本、AI輔助編寫Hive SQL,AI輔助進行SQL性能調優

    主講內容

    大數據開發Hadoop基礎、 Hive基礎、Hive進階

    可掌握的核心能力

    1.掌握Linux常用命令,為數據開發后續學習打下的良好基礎;
    2.掌握大數據的核心框架Hadoop以及其生態體系,完成HDFS、MapReduce及Yarn機制基本理解與使用;能夠搭建Hadoop高可用HA集群;
    3.掌握Hive的使用和調優;
    4.具備Hadoop開發能力、離線數據倉庫開發能力;
    5.能夠完成基本構建企業級數倉。

    可解決的現實問題

    熟悉Linux操作系統,以及各種Linux命令,能夠解決企業級大數據集群搭建問題,為進階大數據開發奠定基礎。

  • 階段三   千億級離線數倉項目

    查看詳細課程大綱課時:11天技術點:105項學習方式:線下面授

    新增AI賦能

    掌握AI輔助數據倉庫建模、Hive SQL調優

    主講內容

    大數據部署運維:Cloudera Manager、分析決策需求:數據倉庫、數據采集:DataX、數據分析:Hive、數據調度:Dolphinscheduler、OLAP系統存儲:PostgreSql、Fine Report數據報表與大屏、數倉建模: 范式與維度建模、五大核心主題域開發(銷售域、供應鏈域、會員域等)

    可掌握的核心能力

    1.掌握泛電商行業離線數倉的分層與建模,從需求、設計、研發、測試到落地上線的完整項目流程;
    2.行業內首個深度講解數倉建模模型方案的主體項目;
    3.包括海量數據場景下如何優化配置;
    4.掌握項目遷移能力,能夠將項目遷移至泛電商的各個領域;
    5.掌握在泛電商行業中關于全量與增量數據處理模式;
    6.提供泛電商行業下的數據存儲分析以及服務監控方案。

    可解決的現實問題

    能夠解決企業級常見數據倉庫搭建,從項目的需求、技術架構、業務架構、部署平臺、ETL設計、作業調度等整套pipeline,完成大數據體系下的企業級數據倉庫構建。

  • 階段四   千億級離線數倉(實戰)

    查看詳細課程大綱課時:4天技術點:40項學習方式:線下面授

    新增AI賦能

    掌握AI輔助調度腳本編寫、指標體系構建

    主講內容

    大數據部署運維:Cloudera Manager、分析決策需求:數據倉庫、數據采集:sqoop、數據分析:Hive、分組完成項目

    可掌握的核心能力

    1.掌握教育行業離線數倉的分層與建模,從需求、設計、研發、測試到落地上線的完整項目流程;
    2.真實業務邏輯,共涉及20多個主題,100多個指標,提升學員在教育行業中的核心競爭力;
    3.包括海量數據場景下如何優化配置;
    4.拉鏈表的具體應用;
    5.新增數據和更新數據的抽取和分析;
    6.Hive函數的具體應用;
    7.ClouderaManager可視化、自動部署和配置、Git、CodeReview功能。

    可解決的現實問題

    按照企業級大數據開發流程,獨立完成項目開發,掌握企業級多場景大數據離線數倉開發能力,從數倉分層,數倉建模,指標統計,指標展示完成完整的大數據項目。

  • 階段五   BI報表開發項目實戰

    查看詳細課程大綱課時:4天技術點:40項學習方式:線下面授

    新增AI賦能

    掌握AI輔助調度腳本編寫、指標體系構建

    主講內容

    掌握AI輔助SQL代碼開發

    可掌握的核心能力

    1.掌握BI報表開發需求分析
    2.掌握BI報表工具
    3.掌握FineReport報表

    可解決的現實問題

    掌握使用量最廣BI報表開發工具FineReport,能夠基于FineReport完成不同行業BI報表開發及業務決策。

  • 階段六   Python基礎編程

    查看詳細課程大綱課時:7天技術點:80項 測驗:1次 學習方式:線下面授

    新增AI賦能

    掌握AI輔助編寫Python代碼開發

    主講內容

    Python基礎語法、Python面向對象、Python高級語法、 Python多任務編程、Python網絡編程

    可掌握的核心能力

    1.掌握Python開發環境基本配置;
    2.掌握運算符、表達式、流程控制語句、數組等的使用;
    3.掌握字符串的基本操作;
    4.初步建立面向對象的編程思維;
    5.熟悉異常捕獲的基本流程及使用方式;
    6.掌握類和對象的基本使用方式;
    7.知道多進程多線程的原理。

    可解決的現實問題

    熟練掌握Python語言,建立編程思維,使學員能夠熟練使用Python技術完成程序編寫。
    熟練使用Python面向對象程序設計思想,掌握數據開發必備Python高級語法,解決常見Python開發問題。

  • 階段七   數據分析

    查看詳細課程大綱課時:8天技術點:100項 學習方式:線下面授

    新增AI賦能

    掌握AI輔助代碼編寫,解決Bug、業務指標構建

    主講內容

    Pandas庫的使用、 數據可視化技術、數據分析常用思維與模型、數據分析報告撰寫

    可掌握的核心能力

    1.掌握Pandas等Python數據分析庫的使用
    2.掌握Matplotlib,Seaborn等數據可視化庫的使用
    3.掌握AIPL、AARRR、RFM等常用數據分析思維與模型的使用
    4.數據分析報告的撰寫
    5.掌握從數據處理一直到輸出報告的全流程,掌握數據分析師具備的常用技能

    可解決的現實問題

    熟練掌握Pandas,Matplotlib,Seaborn等數據處理與可視化開源庫的使用, 能夠應用常用數據分析思維與模型解決業務問題并輸出數據分析報告。

  • 階段八   Spark技術棧

    查看詳細課程大綱課時:10天技術點:80項 測驗:1次 學習方式:線下面授

    新增AI賦能

    掌握AI輔助編寫Spark開發代碼、編寫SparkSOL、解決Bug、性能調優

    主講內容

    大數據Spark技術棧、SparkSQL數據處理與統計分析、Spark案例實戰

    可掌握的核心能力

    1.掌握Spark的RDD、DAG、CheckPoint等設計思想;
    2.掌握SparkSQL結構化數據處理,Spark On Hive;
    3.掌握Structured Streaming整合多數據源完成實時數據處理;
    4.具備Spark全棧開發能力,滿足大數據行業多場景統一技術棧的數據開發,提供就業核心競爭力。

    可解決的現實問題

    掌握全球熱門的Spark技術棧,通過SparkCore和SparkSQL解決數據處理與統計分析工作,進階高級大數據開發工程師。

  • 階段九   用戶畫像解決方案

    查看詳細課程大綱課時:12天技術點:100項 學習方式:線下面授

    新增AI賦能

    掌握AI輔助編寫PySpark開發代碼、解決Bug、性能調優

    主講內容

    SparkSQL整合ES自定義數據源、DS任務界面化調度、用戶畫像標簽構建規則、用戶畫像規則類標簽構建、用戶畫像統計類標簽構建

    可掌握的核心能力

    1.掌握SparkSQL整合ES自定義數據源;
    2.掌握用戶畫像構建流程;
    3.掌握用戶畫像標簽構建規則;
    4.掌握用戶畫像規則類標簽構建;
    5.掌握用戶畫像統計類標簽構建。

    可解決的現實問題

    項目提供了全行業用戶畫像解決方案, 使用SparkSQL+ES+DS構建企業級用戶畫像,通過SparkSQL+MySQL構建通用行業用戶畫像標簽體系。

  • 階段十   大模型Agent應用開發

    查看詳細課程大綱課時:2天技術點:40項 學習方式:線下面授

    新增AI賦能

    掌握AI Agent構建數據分析領域智能體,助力高效數據分析

    主講內容

    基于Agent的數據庫查詢操作、大模型Function Cal原理與實現、Assistant APl的原理及應用、基于本地知識庫搭建答疑聊天機器人

    可掌握的核心能力

    1.能夠利用AI大模型相關技術,構建AlAgent的數據開發相關應用,助力高效數據開發

    可解決的現實問題

    掌握如何使用AI大模型幫助數據開發和數據分析編程效率提升,具備使用AI大模型解決問題的能力。

  • 階段十一   面試加強

    查看詳細課程大綱課時:5天技術點:30項 測驗:1次 學習方式:線下面授

    新增AI賦能

    通過AI大模型提高刷題效率

    主講內容

    核心技能知識點以及常見面試題強化學習

    可掌握的核心能力

    1.強化面試就業核心面試題;
    2.梳理大數據架構及解決方案;
    3.剖析多行業大數據架構。

    可解決的現實問題

    對學習的內容進行整體回顧,并分析經典面試題,指導簡歷,面試和溝通技巧。

  • 階段十二   阿里云實時計算技術

    查看詳細課程大綱課時:6天技術點:80項 測驗:1次 學習方式:線下面授

    新增AI賦能

    掌握基礎AI輔助編寫需求代碼、解決代碼Bug

    主講內容

    阿里云Flink入門、Flink SQL、Flink作業開發、阿里云Flink運維

    可掌握的核心能力

    1.掌握基于阿里云Flink進行實時和離線數據處理、分析;
    2.掌握基于阿里云Flink的多流并行處理技術;
    3.掌握FlinkCDC多數據源采集技術。

    可解決的現實問題

    掌握當下熱門的流批一體化分布式計算框架阿里云Flink及其生態,解決實時計算經典場景問題,適應市場對阿里云Flink越發增長的需求。

  • 階段十三   阿里云實時計算項目

    查看詳細課程大綱課時:7天技術點:80項 學習方式:線下面授

    新增AI賦能

    掌握基礎AI輔助編寫需求代碼、解決代碼Bug選擇

    主講內容

    基于阿里云Flink + Kafka + Paimon 湖倉一體技術架構,實現在線視頻行業大規模流數據處理和實時分析。本項目依托 阿里云 Flink 流處理計算引擎, 通過 FlinkCDC 實時采集 RDS MySQL 數據庫數據,實現數據采集的斷點續傳,使用Kafka 作為實時數倉,使用 Paimon 實現數據的持久化和Flink 批處理,實現計算的流批一體,數據存儲的湖倉一體,采用StarRocks對接DataV完成實時業務大屏展示。

    可掌握的核心能力

    1.湖倉一體化解決方案基于Flink+Paimon湖倉一體技術架構;
    2.基于FlinkCDC完成MySQL等數據源的數據采集;
    3.FlinkSQL流批一體架構實現實時數據計算;
    4.使用StarRocks進行海量多維分析;
    5.掌握數據報表分析;
    6.掌握業務數據實時大屏場景實現。

    可解決的現實問題

    采集超過千萬條在線視頻的數據,實時高性能海量數據分析與存儲業務數據實時大屏場景實現。

查看詳細課程大綱亞秒級實時進階課(免費贈送)課時:8天

提升職場競爭力 實力加倍

學習目標

1.線上3個月進階大數據實時開發,多行業大數據項目助力企業數字人才精英
2.皆在成就實時開發工程師,大數據架構師等,幫助學員成為優秀的實時工程師

技術階段

· 大數據Java語言· 數據采集· NoSQL&消息中心· 實時OLAP框架· 數據湖開發· Flink技術棧
· FlinkSQL原理到精通· 基于DataWorks全鏈路數據開發· 湖倉一體化解決方案· Flink源碼剖析· Flink二次開發

項目階段

· 星途車聯網實時項目· 今日指數證券實時項目

免費試聽 獲取課程大綱
  • 電商 BI開發
  • 新零售 離線數倉
  • 新零售 實時數倉
  • 智慧出行 開源
  • 智慧出行 阿里云
  • 基于FineReport的BI項目NEW

    基于某B2B互聯網電商平臺為背景,根據訂單信息、門店信息、店鋪信息以及商品信息等進行分析,制作不同需求報表,以供業務人員和管理人員每天查看分析并制定相應的措施,為企業經營決策提供數據支撐,從而實現公司利益最大化。

    應用場景

    ETL數據開發定時調度BI報表設計

    項目優勢

    完整的BI項目開發流程、全方面掌握FineReport報表開發、提供BI項目的全方位解決方案

    立即體驗項目 查看更多項目
  • 企業級真實新零售大數據項目NEW

    項目以新零售業務為背景,真實還原企業業務與需求。通過從0到1的搭建和開發流程,使學生掌握離線數倉技術棧的同時,能夠極大提高需求分析與開發能力。

    應用場景

    多源數據遷移海量數據存儲離線數倉設計與實現

    項目優勢

    技術架構主流、項目真實度高、教學設計合理、調優策略豐富

    立即體驗項目 查看更多項目
  • 基于流批一體架構的新零售大數據項目NEW

    項目以Flink、Hudi、Hive為核心組件,打造成企業級流批一體數倉系統,具備延遲低、成本低和吞吐量大等特點,可以滿足企業的所有實時和離線需求。通過項目學習,可以對流批一體的的應用有更深的理解,助力高薪就業。

    應用場景

    流批一體數據采集流批一體數據存儲流批一體數據計算

    項目優勢

    先進的流批一體架構、項目真實度高、教學設計合理

    立即體驗項目 查看更多項目
  • 出行行業流批一體數據倉庫NEW

    以人們息息相關的出行業務為背景,以時下火熱的流批一體架構來實現的PB級數據倉庫。通過學習,使同學掌握Flink和Paimon為主體的大數據技術棧,并通過數倉開發教學與實戰,極大提高數倉開發能力。

    應用場景

    流批一體數據采集流批一體數據存儲流批一體數據計算

    項目優勢

    業務新穎易理解、技術先進且實用、講練結合吸收好

    立即體驗項目 查看更多項目
  • 基于阿里云的出行大數據項目NEW

    隨著云平臺的普及,越來越多的公司使用云平臺來開發大數據應用。項目采用DataWorks+MaxCompute和阿里云Flink兩大主流解決方案,來實現離線數倉和實時數倉搭建,使學生充分掌握云平臺的使用,并提高整體開發能力。

    應用場景

    云平臺存儲云平臺計算數據倉庫開發

    項目優勢

    業務新穎易理解、云平臺應用就業廣、離線實時全覆蓋

    立即體驗項目 查看更多項目

史老師

大數據架構師
擁有豐富的技術攻堅經驗 多年大數據架構及開發經驗,對數據分析,大數據開發,后端開發等技術有深入了解。在多家軟件公司擔任開發工程師, 架構師

趙老師

Apache Pulsar社區貢獻者
擅長數倉領域 從事多年爬蟲與大數據開發與教學,對大數據的主流框架有著深入的理解 參與并主導的項目涉及分布式電商,數據爬取,離線分析等多個行業

張老師

Apache Flink源碼貢獻者
ApacheCon Asia 2022亞洲峰會特邀講師 曾任網易游戲大數據平臺組項目經理、高級專家、技術總監等職務 主導設計游戲一體化大數據運營平臺

曹老師

Apache Flink源碼貢獻者
擅長大數據云平臺技術領域 曾擔任京東及小米有品電商部擔任大數據部門技術骨干。擁有萬億級數據處理經驗 具有多年大數據領域和云平臺研發經驗

孔老師

架構師,技術經理
熟悉大數據&數據庫&后端&前端 曾在途牛旅游網、江蘇移動等公司擔任技術經理和架構師,負責優化技術架構和系統流程,解決性能、效率、維護等問題

趙老師

985計算機碩士
ApacheCon Asia 2022亞洲峰會特邀講師 主導研發多項國家和省級科研項目,負責企業級信貸風控模型和智能醫療數據平臺開發 任職頭部互聯網企業搜索部負責搜索排序及推薦平臺研發

李老師

985計算機碩士
Apache Doris社區貢獻者 曾任職于百度搜索研發部負責搜索推薦業務,主導多項產品實施落地 曾任中國電子科技集團公司第七研究所技術專家

行業貢獻: 受邀參加云棲大會、Apache Flink Aisa Metting、Apache CosCon Aisa Meeting等行業大會,并發表主旨演講
Apache Flink社區源碼貢獻者 2名Apache Pulsar社區貢獻者 1名Apache Hudi社區貢獻者 1名Apache Doris社區貢獻者 1名

與名師對話

在實時計算領域,阿里云實時計算Flink版一直是各大中小企業的主流選擇,期待阿里云與傳智教育的合作能夠培養大量滿足企業實際開發需求的實戰型人才,助力企業在云上更方便、快捷、低成本的構建大數據分析平臺,讓企業和學員都能得到受益。

宋辛童(五藏)Apache Flink Committer,阿里巴巴技術專家,北京大學博士

傳智教育一直以高質量的教學口碑引領著IT教育培訓,積極參與開源貢獻并在全球頂級開峰會進行技術分享,其推出的教學視頻更是讓眾多開發者快速的擁抱前沿開源技術,推動了開源項目的發展。期待傳智教育推出更多優質的開源課程,讓千千萬萬的IT學子少走彎路,也期待與開源社區繼續深入合作,一起把優秀的開源項目推向全球!

李崗ASF Member,Apache DolphinScheduler PMC

中國開源軟件的發展和崛起離不開培訓機構的大力傳播,傳智教育作為在IT培訓領域知名的機構,推出了大量的開源項目相關的優質視頻,讓很多想從事IT的小伙伴和從業者能夠從中受用。同時傳智也有不少老師身體力行地為開源獻力:或提交源碼、或分享實踐、或傳道受業解惑,展現了“開源參與你我他”的精神,期待傳智教育能夠培養出來更多熱愛開源的人才,讓中國開源軟件能夠立足中國,貢獻全球

代立冬白鯨開源聯合創始人、Apache 孵化器導師,Apache DolphinScheduler PMC Chair& Apache SeaTunnel PMC、ApacheCon 亞洲大數據湖倉論壇出品人,中國開源先鋒

  • 全日制教學管理每天10小時專屬學習計劃
    測試、出勤排名公示
    早課+課堂+輔導+測試+心理疏導

  • 實戰項目貫穿教學一線大廠實戰項目
    實用技術全面覆蓋
    課程直擊企業需求

  • AI教輔保障學習效果水平測評,目標導向學習
    隨堂診斷糾錯,階段測評
    在線題庫,BI報表數據呈現

  • 個性化就業指導就業指導課,精講面試題
    模擬面試,給出就業建議
    試用期輔導,幫助平穩過渡

  • 持續助力職場發展免費享,更新項目和學習資料
    主題講座,獲取行業前沿資訊
    人脈經驗,線下老學員分享會

  • 無憂學就業權益未就業,全額退費
    薪資低于標準,發放補貼
    多一份安心,學習無憂

  • 1教學管理
  • 2項目實戰
  • 3教輔促學
  • 4求職指導
  • 5職后提升
  • 6無憂學

* 學員就業信息統計數據為數據庫中實時獲取的真實相關數據,非廣告宣傳 更多學員就業信息

聽一聽黑馬學員的真實就業感受

0元試學 滿意再報名

更多>>Python+大數據學科動態

  • 01黑馬程序員聯合SelectDB公司,Apache Doris中文視頻教程已上線!
  • 02再升級! 業務+技術并重,Python+大數據開發課程V3.0
  • 03傳智教育攜手天津經開區人社局推動職業技能競賽廣泛開展
  • 04傳智教育與阿里云達成深度合作,共同培養高新數字化人才
  • 05薪資暴漲!黑馬Python+大數據開發學科新項目揭秘!
  • 06抓住機會有多重要?未來大數據行業的機遇在...

更多>>python+大數據技術資訊

  • 01新版Python安裝圖文教程[很詳細]
  • 02有哪些防爬蟲/反爬蟲的策略方法?
  • 03Python語言這么火發展前景怎么樣?
  • 04Python爬蟲可以做什么?
  • 05Python日志模塊 logging怎么用?
  • 06Python是什么?Python可以用來做什么?
  • 07Python開發工程師培訓技術資訊

更多>>Python培訓常見問題

  • 01Python入門教程推薦
  • 02Python培訓課程哪個好?
  • 03代碼編程教學入門
  • 04普通人學Python有意義嗎?
  • 05網上學Python靠譜嗎?
  • 06Python培訓費用一般多少錢?

AI+Python大數據課程體系V5.0

聚集多位Apache 社區貢獻者及大廠技術講師,聯合推出行業重磅AI+Python大數據V5.0課程,通過5-6個月學習進階數據開發工程師,獲取3-4年開發經驗,對標高級數據開發工程師。

AI+Python大數據V5.0學習路線概覽

第一階段第二階段第三階段第四階段第五階段

數據庫基礎 Hadoop技術棧 千億級離線數倉項目 千億級離線數倉(實戰) BI報表開發項目實戰

第六階段第七階段第八階段第九階段

Python基礎編程 數據分析 Spark技術棧 用戶畫像解決方案

第十階段第十一階段第十二階段第十三階段

大模型Agent應用開發 面試加強 阿里云實時計算技術 阿里云實時計算項目

AI+Python大數據V5.0 五大課程優勢:

優勢1:AI大模型全程賦能,讓數據分析更精準,開發更高效;
優勢2:1000+核心業務指標,多行業高效通用;
優勢3:前沿解決方案拿來即用,開發不必從零開始;
優勢4:聯合阿里云共建課程, 助力企業“上云”便捷開發;
優勢5:課程設置全面,熱門數據崗位全覆蓋 。

  • AI大模型全程賦能,讓數據分析更精準,開發更高效 AI提高學習效率:全部技術階段融入AI編程
    AI提高項目開發效率:全階段項目融入AI編程
    AI提高閱讀代碼效率:復雜Spark算子的底層源碼解讀
    通過AI提高刷題效率:學員能夠用使用AI大模型進行數據開發方向面試題問答,讓刷題更高效

敢以班級為單位公開就業信息的機構,只有黑馬程序員!通過數千班級實施和就業結果顯示,黑馬程序員Python+大數據開發的課程,有效大幅提升就業薪資水平!

課程大綱

  1. 基礎班

    1. 數據庫基礎

  2. 高手班

    1. Hadoop技術棧 2. 千億級離線數倉項目 3. 千億級離線數倉實戰 4. BI報表開發項目實戰 5. Python基礎編程 6. 數據分析 7. Spark技術棧 8. 用戶畫像解決方案 9. 大模型Agent應用開發 10. 面試加強 11. 阿里云實時計算技術 12. 阿里云實時計算項目

  3. Python+大數據版本V5.0

  • 數據庫基礎基礎班 1

    課時:8天 技術點:60項 測驗:1次 學習方式:線下面授

    學習目標

    1.掌握MySQL數據庫的使用| 2.掌握SQL語法| 3.掌握Kettle數據遷移工具的使用| 4.熟練使用BI可視化工具| 5.對數據開發有一定認知,掌握BI工程師所具備的基本技能

    主講內容

    1. MySQL與SQL零基礎小白通過MySQL數據庫,掌握核心必備SQL,包含了以下技術點:

    1.數據庫環境搭建| 2.SQL語言(DDL、DML、DQL)| 3.多表查詢| 4.索引等

    2. Kettle與BI工具使用Kettle做數據遷移,通過BI工具展示Excel、MySQL中的數據,包含了以下技術點:

    1.數據倉庫與ETL| 2.Kettle安裝部署| 3.數據抽取與裝載入門| 4.表輸入組件| 5.表輸出| 6.插入/更新| 7.switch/case等組件使用,開發Kettle作業等

    3. 電商運營指標分析通過Kettle+MySQL+FineBI完成電商運營指標分析,包含了以下技術點:

    1.電商業務背景| 2.案例架構| 3.數據倉庫數據增量同步| 4.ETL開發| 5.指標SQL開發| 6.Kettle作業調度| 7.FineBI可視化展示等

  • Hadoop技術棧高手班 1

    課時:13天 技術點:8項 測驗:0次 學習方式:線下面授

    學習目標

    1.掌握Linux常用命令,為數據開發后續學習打下的良好基礎| 2.掌握大數據的核心框架Hadoop以及其生態體系,完成HDFS、MapReduce及Yarn機制基本理解與使用;能顧搭建Hadoop高可用HA集群| 3.掌握Hive的使用和調優| 4.具備Hadoop開發能力、離線數據倉庫開發能力| 5.能夠完成基本構建企業級數倉

    主講內容

    1. Linux掌握Linux操作系統常用命令和權限管理,包含了以下技術點:

    1.Linux系統安裝和體驗| 2.Linux系統網絡配置和連接工具| 3.Linux系統目錄結構| 4.Linux命令使用| 5.Linux命令選項的使用| 6.遠程登錄和遠程拷貝| 7.Linux權限管理| 8.vi編輯器使用| 9.sed| 10.awk| 11.權限管理

    2. 大數據基礎和硬件介紹進一步闡述大數據特點與分布式思想,知識點由淺入深,包含了以下技術點:

    1.大數據的特點| 2.分布式存儲概念| 3.分布式計算的概念| 4.服務器種類介紹、機架、交換機| 5.網絡拓撲、Raid、IDC數據中心| 6.Linux shell編程、awk、sed、cut、ssh、scp、expect、yum、nestat、top 、iostat等高級命令使用

    3. ZooKeeper分布式軟件管家,實現了集群管理與leader選舉,包含了以下技術點:

    1.ZooKeeper的應用場景| 2.架構和原理| 3.存儲模型| 4.選舉機制| 5.客戶端操作

    4. HDFS分布式文件系統,解決了海量數據存儲與容錯,包含了以下技術點:

    1.HDFS設計的特點| 2.Master-Slave架構| 3.Block塊存儲、RF拷貝因子、機架感知| 4.Block拷貝策略、讀寫流程| 5.HDFS Federation、HDFS Snapshots、NameNode HA架構和原理| 6.HDFS管理員常用操作、HDFS權限控

    5. MapReduce分布式計算系統,解決海量數據的計算,包含了以下技術點:

    1.MapReduce架構和原理| 2.Split機制| 3.MapReduce并行度| 4.Combiner機制| 5.Partition機制、自定義Partition| 6.MapReduce序列化、自定義排序、數據壓縮

    6. YARN分布式資源調度管理器,管理服務器軟件資源,包含了以下技術點:

    1.Yarn原理和架構| 2.Yarn高可用| 3.Container資源的封裝(CPU、內存和IO)| 4.資源調度策略(FIFO、Fair和Capacity)

    7. Hive基礎數據倉庫Hive,實現企業級數倉必備工具,包含以下知識點:

    1.HQL操作| 2.數據類型| 3.分區、分桶、臨時表| 4..explain執行計劃詳解

    8. Hive進階數據倉庫Hive高階原理和架構深入,實現企業級數倉優化,包含以下知識點:

    1.Hive原理和架構 2.Meta Store服務 3.HiveServer內置函數 4.自定義UDF和UDAF 5.數據壓縮、存儲格式、自動化腳本、常見性能優化

  • 千億級離線數倉項目高手班 2

    課時:11天技術點:105項測驗:0次學習方式:線下面授

    學習目標

    1.掌握泛電商行業離線數倉的分層與建模,從需求、設計、研發、測試到落地上線的完整項目流程| 2.行業內首個深度講解數倉建模模型方案的主體項目| 3.包括海量數據場景下如何優化配置| 4.掌握項目遷移能力,能夠將項目遷移至泛電商的各個領域| 5.掌握在泛電商行業中關于全量與增量數據處理模式| 6.提供泛電商行業下的數據存儲分析以及服務監控方案

    本項目基于某泛電商研發的大數據分析平臺。項目原型來自于某大型生鮮平臺,完全模擬企業真實數倉開發模式,擁有真實的主題化開發;真實的數據結構,復雜的SQL實現過程,學生學習以后可以開發企業級離線數倉的水平。

    主講解決方案

    1.項目介紹與環境準備| 2.數據遷移與數倉分層設計| 3.核心五大主題域開發| 4.基于Fine Report的大屏展示| 5.基于海豚調度的全流程項目上線實施| 5.提供新泛電商大型商超集團的數據存儲分析以及服務監控方案

    主講知識點

    1.大數據部署運維:Cloudera Manager| 2.分析決策需求數據倉庫:Hive| 3.數據采集:DataX| 4.數據分析:Hive| 5.數據調度:Dolphin Scheduler| 6.OLAP系統存儲:Postgre SQL| 7.Fine Report數據報表與大屏| 8.數倉建模:范式與維度建模| 9.五大核心主題域開發:銷售域、供應鏈域、會員域等

  • 千億級離線數倉實戰高手班 3

    課時:4天技術點:40項測驗:0次學習方式:線下面授

    學習目標

    1.掌握泛電商行業離線數倉其他主題的分層與建模,從需求、設計、研發、測試到落地上線的完整項目流程| 2.真實業務邏輯,共涉及20多個主題,100多個指標,提升學員在泛電商行業中的核心競爭力| 3.包括海量數據場景下如何優化配置| 4.拉鏈表的具體應用| 5.新增數據和更新數據的抽取和分析| 6.Hive函數的具體應用| 7.Cloudera Manager可視化、自動部署和配置、Git、CodeReview功能

    本項目基于某泛電商研發的大數據分析平臺。項目原型來自于某大型生鮮平臺,完全模擬企業真實數倉開發模式,擁有真實的主題化開發;真實的數據結構,復雜的SQL實現過程,學生學習以后可以開發企業級離線數倉的水平。

    主講解決方案

    1.項目介紹與環境準備| 2.數據遷移與數倉分層設計| 3.核心五大主題域開發| 4.基于Fine Report的大屏展示| 5.基于海豚調度的全流程項目上線實施| 5.提供新泛電商大型商超集團的數據存儲分析以及服務監控方案

    主講知識點

    1.大數據部署運維:Cloudera Manager| 2.分析決策需求數據倉庫:Hive| 3.數據采集:DataX| 4.數據分析:Hive| 5.數據調度:Dolphin Scheduler| 6.OLAP系統存儲:Postgre SQL| 7.Fine Report數據報表與大屏| 8.數倉建模: 范式與維度建模| 9.五大核心主題域開發: 銷售域、供應鏈域、會員域等

  • BI報表開發項目實戰高手班 4

    課時:4天技術點:40項測驗:0次學習方式:線下面授

    學習目標

    1.掌握BI報表開發需求分析| 2.掌握BI報表工具| 3.掌握FineReport報表

    數據可視化能力早已成為新時代優秀工程師必備素養。項目結合FineReport、Python、MySQL、Kettle等主流工具,手把手帶你開發一個完整的BI項目,全流程特訓你的數據可視化能力,助力你迅速成為數據時代的新銳開發者。

    主講解決方案

    FineReport報表開發解決方案| BI報表開發技術解決方案| 報表查詢解決方案設計| 泛電商行業五大主題解決方案

    主講知識點

    1.BI報表開發需求分析| 2.BI報表工具| 3.FineReport報表入門| 4.泛電商行業五大主題的實現

  • Python基礎編程高手班 5

    課時:7天 技術點:80項 測驗:1次 學習方式:線下面授

    學習目標

    1.掌握Python開發環境基本配置| 2.掌握運算符、表達式、流程控制語句、數組等的使用| 3.掌握字符串的基本操作| 4.初步建立面向對象的編程思維| 5.熟悉異常捕獲的基本流程及使用方式| 6.掌握類和對象的基本使用方式| 7.掌握網絡編程技術,能夠實現網絡通訊| 8.知道多進程多線程的原理

    主講內容

    1. Python基礎語法零基礎學習Python的開始,包含了以下技術點:

    01_變量| 02_標識符和關鍵字| 03_輸入和輸出| 04_數據類型轉換| 05_PEP8編碼規范| 06_比較/關系運算符| 07_if判斷語句語法格式| 08_三目運算符| 09_while語句語法格式| 10_while 循環嵌套| 11_break 和 continue| 12_while 循環案例| 13_for循環

    2. Python數據處理掌握Python的數據類型,并對其進行操作處理,包含了以下技術點:

    01_字符串定義語法格式| 02_字符串遍歷| 03_下標和切片| 04_字符串常見操作| 05_列表語法格式| 06_列表的遍歷| 07_列表常見操作| 08_列表嵌套| 09_列表推導式| 10_元組語法格式| 11_元組操作| 12_字典語法格式| 13_字典常見操作| 14_字典的遍歷

    3. 函數能夠實現Python函數的編寫,包含了以下技術點:

    01_函數概念和作用、函數定義、調用| 02_函數的參數| 03_函數的返回值| 04_函數的注釋| 05_函數的嵌套調用| 06_可變和不可變類型| 07_局部變量| 08_全局變量| 09_組包和拆包、引用

    4. 文件讀寫能夠使用Python對文件進行操作,包含了以下技術點:

    01_文件的打開與關閉、文件的讀寫| 02_文件、目錄操作及案例| 03_os模塊文件與目錄相關操作

    5. 異常處理主要介紹了在Python編程中如何處理異常,包含了以下技術點:

    01_異常概念| 02_異常捕獲| 03_異常的傳遞

    6. 模塊和包主要介紹了Python中的模塊和包的體系,以及如何使用模塊和包,包含了以下技術點:

    01_模塊介紹| 02_模塊的導入| 03_包的概念| 04_包的導入| 05_模塊中的__all__ | 06_模塊中__name__

    7. Python面向對象從逐步建立起面向對象編程思想,再到會使用對象,到創建對象,再到真正理解為什么封裝對象,包含了以下技術點:

    01_面向對象介紹| 02_類的定義和對象的創建| 03_添加和獲取對象屬性| 04_self 參數| 05_init方法| 06_繼承| 07_子類方法重寫| 08_類屬性和實例屬性| 09_類方法、實例方法、靜態方法

    8. Python高級語法主要學習Python的高級語法,包含以下技術點:

    01_閉包| 02_裝飾器| 03_深淺拷貝| 04_正則

  • 數據分析高手班 6

    課時:8天 技術點:100項 測驗:1次 學習方式:線下面授

    學習目標

    1.掌握Pandas的使用方式 2.掌握常用數據指標計算方法 3.掌握如何使用Python進行RFM分群 4.掌握使用Python代碼進行用戶行為分析

    主講內容

    1. Python數據分析基礎本階段學習如何使用Juypter_notebook和 Pandas庫對數據進行處理, 包括以下技術點:

    1.Jupyter Notebook的使用| 2.Pandas數據結構| 3.Pandas數據增刪改查| 4.Pandas常用函數| 5.Pandas缺失值異常值處理

    2. Python數據可視化本階段學習如何使用 Matplotlib、Pandas、 Seaborn進行數據可視化,包括以下技術點

    1.可視化常用圖表介紹| 2.Matploblib數據可視化| 3.Pandas數據可視化| 4.Seaborn數據可視化

    3. 業務數據分析實戰本階段學習如何使用Pandas,Excel等工具解決具體業務問題, 包括以下技術點:

    1.Pands報表自動化| 2.常用業務分析模型介紹| 3.用戶分層與分群實戰| 4.用戶評論分析實戰| 5.用戶偏好分析| 6.指標波動分析| 7.數據分析報告

  • Spark技術棧高手班 7

    課時:10天 技術點:80項 測驗:1次 學習方式:線下面授

    學習目標

    1.掌握Spark的架構和原理、RDD、DAG、CheckPoint等設計思想| 2.掌握SparkSQL結構化數據處理,Spark On Hive| 3.掌握Kafka消息隊列的原理和架構設計、分布式實時計算架構和思想 4.掌握Structured Streaming整合多數據源完成實時數據處理| 5.具備Spark全棧開發能力,滿足大數據行業多場景統一技術棧的數據開發,提供就業核心競爭力

    主講內容

    1. Spark基礎本階段學習Spark環境搭建,包含了以下技術點:

    1.Spark基礎環境搭建| 2.Spark的Standalone環境搭建| 3.Spark的StandaloneHA搭建| 4.SparkOnYarn環境搭建

    2. Spark Core整個Spark框架核心部分,掌握框架內部設計思想,數據流轉步驟,是學習Spark的基礎模塊,包含了以下技術點:

    1.Spark架構和原理(運行機制、Driver和Executor、spark任務提交流程)| 2.RDD開發和原理(Partition、Task、RDD的依賴關系、RDD的容錯機制、RDD的存儲級別、RDD的緩存機制)廣播變量 | 3.DAG原理(DAG思想、DAG的生成、DAG的處理過程)

    3. Spark SQL學習Spark框架的SQL操作,Spark與Hive等外部數據源的整合操作,包含了以下技術點:

    1.Spark SQL架構和原理| 2.DataFrame、DataSet DSL和SQL開發| 3.Spark多數據源整合(txt、CSV、Json、parquet、JDBC、Hive)| 4.Spark SQL執行計劃原理| 5.Spark SQL性能調優

    4. Kafka消息隊列主要講解消息中間件核心知識,包含了以下技術點:

    1.Kafka原理及架構分析| 2.分布式實時計算架構和思想| 3.陌陌社交場景實戰| 4.社交大數據架構剖析

    5. StructedStreaming主要講解Spark實時計算組件,整合Kafka+StructedStreaming,包含了以下技術點:

    1.流式計算基礎概念| 2.Structured Streaming編程模型| 3.Structured Streaming整合Kafka| 4.Structured Streaming實時數據處理與統計分析

  • 用戶畫像解決方案高手班 8

    課時:12天技術點:100項測驗:0次學習方式:線下面授

    學習目標

    1.掌握用戶畫像應用場景| 2.掌握用戶畫像系統架構| 3.掌握用戶畫像構建流程| 4.掌握用戶畫像規則類標簽構建| 5.掌握用戶畫像統計類標簽構建| 6.熟悉用戶畫像挖掘類標簽構建| 7.掌握用戶畫像實時類標簽構建| 8.掌握SeaTunnel數據同步組件| 9.掌握ES和Doris結果存儲| 10.了解推薦系統使用

    項目以電商為背景,提供全方位的標簽體系、完整的標簽構建流程、先進的用戶畫像技術架構, 使用Spark+ES+Doris完成海量數據的處理及各類標簽計算與存儲,充分滿足企業離線和實時需求,為全行業用戶畫像系統提供了解決方案。

    主講解決方案

    用戶畫像解決方案,主要針對于泛電商或保險行業完成用戶標簽設計與開發,提供了全行業解決方案。課程采用由淺入深,層層遞進的講解方式,讓學生輕松掌握企業級用戶畫像系統的設計與開發全流程,項目使用的技術棧包括Spark、ES、Doris、SeaTunnel、Kafka,均為時下主流的大數據技術。

    主講知識點

    1.用戶畫像應用場景| 2.用戶畫像系統架構| 3.用戶畫像構建流程| 4.使用Spark Core開發規則類標簽| 5.使用Spark Core和Spark SQL開發統計類標簽| 6.使用Spark MLlib開發挖掘類標簽| 7.使用Structured Streaming開發實時類標簽| 8.使用SeaTunnel做數據同步| 9.使用ES和Doris存儲結果數據| 10.使用Spark MLlib開發推薦系統

  • 大模型Agent應用開發高手班 9

    課時:2天技術點:40項測驗:0次學習方式:線下面授

    學習目標

    掌握AI Agent構建數據分析領域智能體,助力高效數據分析

    項目借助于AI大模型Agent技術搭建AI Agent智能體,助力更加高效數據分析

    主講解決方案

    Agent數據分析智能體

    主講知識點

    1.基于Agent的數據庫查詢操作 2.大模型Function Cal原理與實現 3.Assistant APl的原理及應用

  • 面試加強高手班 10

    課時:5天 技術點:30項 測驗:0次 學習方式:線下面授

    學習目標

    1.強化面試就業核心面試題| 2.梳理大數據架構及解決方案| 3.剖析多行業大數據架構

    主講內容

    1. SQL實戰解決Python大數據常見的SQL面試題,包含了以下技術點:

    1.面試題必備SQL實戰| 2.SQL優化加強

    2. Hive數據分析與面試題加強解決Hive數據分析開發必備面試題,包含了以下技術點:

    1._Hive基礎| 2.Hive拉鏈表| 3.Hive數據倉庫構建示例| 4.Hive面試題

    3. Spark數據分析與面試題加強解決Spark開發必備面試題,包含了以下技術點:

    1.Spark基礎| 2.Spark離線分析| 3.Spark面試題

    4. 大數據多行業架構剖析解決多行業多場景大數據架構設計,具備舉一反三設計大數據架構體系能來,包含了以下技術點:

    1.數據分析流程| 2.大數據架構剖析| 3.多行業大數據架構設計| 4.大數據存儲,調度等解決方案

  • 阿里云實時計算技術高手班 11

    課時:6天 技術點:80項 測驗:1次 學習方式:線下面授

    學習目標

    1.掌握基于阿里云Flink進行實時和離線數據處理、分析| 2.掌握基于阿里云Flink的多流并行處理技術| 3.掌握FlinkCDC多數據源采集技術

    主講內容

    1. 阿里云Flink入門掌握國內最火的阿里云Flink技術,完成SQL、Python等作業提交,包含了以下技術點:

    1.阿里云賬號角色授權| 2.開通Flink全托管| 3.Flink SQL作業快速入門| 4.Flink JAR作業快速入門| 5.Flink Python作業快速入門| 6.數據庫實時入倉快速入門| 7.日志實時入倉快速入門

    2. Flink SQL掌握FlinkSQL流批一體開發流程,集成Flink核心窗口、水印、狀態管理等高級功能,助力高效開發,包含了以下技術點:

    1.Flink SQL開發| 2.Hive + Flink SQL| 3.Watermark| 4.Checkpoint| 5.任務調度與負載均衡| 6.狀態管理| 7.Flink性能監控| 8.Flink調優| 9.Flink SQL執行計劃

    3. Flink作業開發掌握Flink作業開發流程,完成不同方式的作業開發和調試,包含了以下技術點:

    1.作業開發| 2.SQL作業開發| 3.JAR作業開發| 4.Python作業開發| 5.作業調試| 6.模板中心| 7.管理自定義連接器| 8.管理自定義函數(UDF)

    4. 阿里云Flink運維掌握Flink運維流程,針對不同場景通過不同解決方案,達到高效運維使用云平臺,包含了以下技術點:

    1.權限管理| 2.RAM用戶授權| 3.作業操作賬號授權| 4.作業啟動| 5.作業停止| 6.管理作業版本| 7.修改作業配置| 8.查看作業詳情| 9.查看與修改作業運行狀態| 10.調優診斷| 11.查看作業性能| 12.作業智能診斷| 13.配置自動調優| 14.高性能Flink SQL優化技巧| 15.作業狀態管理| 16.企業級狀態后端存儲介紹| 17.作業狀態集管理| 18.Flink State兼容性參考

  • 阿里云實時計算項目高手班 12

    課時:7天技術點:80項測驗:0次學習方式:線下面授

    學習目標

    以阿里云出行項目為例: 1.了解網約車行業背景,了解黑馬出行項目需求| 2.掌握黑馬出行流批一體架構,學會流批一體的具體實現方式| 3.掌握從0到1進行數倉規劃和搭建,極大提高實戰能力| 4.掌握阿里云平臺Flink和DataWorks使用| 5.掌握基于阿里云Flink的實時數據倉庫開發,熟練使用Flink SQL| 6.掌握基于MaxCompute的離線數據倉庫開發,熟練使用MaxCompute SQL| 7.熟悉Paimon技術并掌握項目實戰應用| 8.熟悉StarRocks技術并掌握項目實戰應用| 9.熟悉Flink CDC技術并掌握項目實戰應用| 10.熟練使用FineBI完成大屏開發

    本項目是某出行公司基于阿里云平臺打造的大數據平臺。項目不僅包含實時數倉,也包含離線數倉,還包含數據建模和數據治理等內容。項目以阿里云Flink、Paimon和MaxCompute為核心打造了企業級湖倉一體、流批一體數倉系統,可以滿足企業的實時和離線的所有數據統計需求。

    主講解決方案

    通過對企業需求進行深入分析,設計符合企業需求的大數據平臺,并從0到1完成大數據平臺和數據倉庫的搭建。項目采用阿里云Flink結合Paimon,完成實時計算和流批一體存儲,采用DataWorks+MaxCompute完成離線數倉開發,使用DataWorks完成數據治理等內容,該方案對各行業大數據平臺建設都有極強借鑒意義。

    主講知識點

    1.網約車行業背景及黑馬出行公司介紹| 2.黑馬出行流批一體架構設計| 3.黑馬出行大數據平臺搭建| 4.Flink CDC介紹與使用| 5.Paimon的原理與應用| 6.StarRocks介紹與使用| 7.基于阿里云Flink和Paimon開發實時數倉| 8.基于DataWorks和MaxCompute開發離線數倉| 9.數據倉庫設計與數據建模| 10.基于DataWorks的數據治理| 11.使用FineBI完成大屏開發

  • Python+大數據開發 V版本課程說明

    課程名稱:主要針對:主要使用開發工具:

    課程介紹

“周”更新日志
課程大版本更新

課程更新日志按周更新熱點/前沿技術

  • 新增2024-05-06

    · 黑馬出行業務與平臺介紹

  • 新增2024-04-29

    · Paimon和Hive的集成· Paimon文件操作

  • 新增2024-04-22

    · Paimon的使用

  • 新增2024-04-15

    · Paimon基本介紹 Hudi安裝

  • 新增2024-03-28

    · DataX部署與使用

  • 新增2024-03-22

    · DataX Web部署與使用

  • 升級2024-03-15

    · Hive參數優化

  • 升級2024-03-08

    · 數據同步方案

  • 新增2023-03-01

    · PostgreSQL部署與使用

  • 升級2024-02-23

    · DolphinScheduler使用

  • 升級2024-02-16

    · 數倉項目開發思路

  • 升級2024-02-09

    · FineReport服務器部署· FineReport基本使用

  • 新增2024-02-09

    · FineReport報表開發· FVS大屏開發

  • 新增2024-01-26

    · Flink· CDC· 3.0特性與使用

  • 升級2024-01-19

    · Flink· CDC· DataStream案例和SQL案例

  • 新增2024-01-12

    · Hive Dialect使用· Hive Catalog使用

  • 升級2024-01-05

    · Flink讀寫Hive· Hive維表關聯

  • 新增2023-12-29

    · Hudi簡介· Hudi安裝與簡單使用

  • 新增2023-12-22

    · Hudi核心概念· Flink讀寫Hudi

  • 新增2023-12-15

    · Hudi on Hive的原理和使用

  • 新增2023-12-08

    · Doris簡介· Doris安裝與簡單使用

  • 新增2023-06-21

    · 量化機制的介紹· 圖優化方法的使用

  • 新增2023-12-01

    · Doris Aggregate模型使用· Doris Unique模型使用· Doris Duplicate模型使用

  • 新增2023-11-24

    · Doris Partition劃分· Doris Bucket劃分

  • 新增2023-11-17

    · Broker Load· Stream Load· Routine Load· 數據導出

  • 新增2023-11-10

    · Doris join方式和join 優化

  • 新增2023-11-03

    · Doris Rollup· 物化視圖

  • 新增2023-11-27

    · Doris動態分區

  • 新增2023-10-20

    · Doris多源目錄· Doris與Flink集成

  • 新增2023-10-13

    · Dinky部署· Dinky簡介· Dinky使用

  • 升級2023-10-06

    · 實時數倉開發流程與建模設計

  • 新增2023-09-29

    · 湖倉一體架構開發維度主題

  • 新增2023-09-22

    · 流批一體架構設計

  • 新增2023-09-15

    · 流批一體架構開發電商銷售主題

  • 升級2023-09-08

    · 電商日志解析

  • 新增2023-09-01

    · Taildir Souce與Kafka Channel配合采集日志

  • 升級2023-08-25

    · ProcessFunction使用· FlatMapFunction使用

  • 新增2023-08-18

    · Flink側輸出流使用

  • 升級2023-08-11

    · Flink狀態編程· Flink TTL設置

  • 新增2023-08-04

    · Flink CEP原理介紹· Flink CEP實戰

  • 升級2023-07-28

    · Flink UDTF函數開發與使用

  • 新增2023-07-21

    · 反壓產生的原因及問題的定位

  • 升級2023-07-14

    · KafkaSource調優

  • 升級2023-07-07

    · Flink SQL的調優· Flink內存調優

  • 新增2023-06-30

    · Flink JDBC工具類編寫· Flink Kafka工具類編寫

  • 新增2023-06-15

    · yoloV8的架構解析· 雙流FPN結構的設計

  • 新增2023-06-08

    · FlinkSQL表參數· FlinkSQL解析器

  • 新增2023-06-02

    · FlinkSQL的Split分桶· FlinkSQL執行計劃翻譯器參數

  • 新增2023-05-26

    · FlinkSQL的上游CDC去重· FlinkSQL多階段聚合

  • 新增2023-05-18

    · FlinkSQL參數優化· FlinkSQL異步IO容量· FlinkSQL并行度設置

  • 新增2023-05-12

    · FlinkSQL語法· FlinKSQL UDF

  • 新增2023-05-06

    · Barrier(柵欄)機制

    升級

    · PyFlink

  • 新增2023-04-27

    · Flink狀態后端· Flink重啟策略

  • 新增2023-04-19

    · 窗口計算中時間的流逝問題· 窗口的開始和結束范圍

  • 新增2023-04-12

    · Window TVF 方案· Group Window Aggregation方案

  • 新增2023-04-07

    · 動態表和連續查詢· Flink中的時間屬性

  • 新增2023-03-31

    · sql-client和Flink JobManager的連接· sql-client結果的顯示模式

  • 新增2023-03-23

    · TableEnvironment· sql-client 工具

    升級

    · Flink Table & SQL API

  • 新增2023-03-14

    · Oracle的備份恢復· Oracle的OEM· Oracle的冷熱備份· Oracle的備份恢復

  • 新增2023-03-09

    · Oracle的權限管理· Oracle的審計

  • 新增2023-03-01

    · Oracle的進程結構和內存結構· Oracle的監聽器

  • 新增2023-02-22

    · Oracle數據庫管理· Oracle存儲結構

  • 新增2023-02-16

    · Oracle的存儲函數· Oracle的存儲過程· Oracle的觸發器

  • 新增2023-02-08

    · Oracle的PLSQL編程· Oracle的游標

  • 新增2023-02-03

    · Oracle索引· Oracle事務· Oracle常用工具

  • 新增2023-01-29

    · Oracle序列· Oracle同義詞

  • 新增2023-01-18

    · Oracle視圖· Oracle物化視圖

  • 新增2023-01-10

    · Oracle數據定義語言· Oracle常見對象

  • 新增2023-01-04

    · Oracle基礎· Oracle的查詢語法及綜合案例

  • 新增2022-12-27

    · Hive的explain執行計劃詳解· Hive數據壓縮、存儲格式、自動化腳本、常見性能優化內容優化

  • 新增2022-12-21

    · PSM價格敏感度模型開發· Presto對接多數據源實現指標統計分析

  • 新增2022-12-13

    · RFM用戶價值度模型開發· RFE用戶或月底模型開發

  • 新增2022-12-07

    · 用戶畫像解決方案項目BI可視化實時統計結果數據· 用戶畫像解決方案項目BI可視化流程

  • 新增2022-12-01

    · 用戶行為埋點日志etl· 用戶行為埋點日志聚合統計· 用戶行為埋點日志統計結果入庫

  • 新增2022-11-24

    · 用戶行為埋點日志產生流程與漏斗模型

  • 新增2022-11-17

    · nginx日志ip定位,uv、pv、ua、access_time解析· nginx日志入庫mysql· 實時分析任務基類開發

  • 新增2022-11-08

    · nginx日志介紹與產生的流程· nginx日志解析etl· nginx日志聚合統計

  • 新增2022-11-03

    · 操作采集nginx日志到kafka中· 結構化流實現消費nginx日志數據案例

  • 新增2022-10-26

    · flume實現采集數據到hdfs· flume實現數據采集到kafka· 實時基礎與kafka要點回顧

  • 新增2022-10-20

    · flume與實時數據采集流程· flume概述與核心要素· 標簽類型與總結

  • 新增2022-10-13

    · 購買周期標簽思路與實現· 支付方式標簽思路與實現· 標簽類型與總結

  • 新增2022-10-07

    · 作業講解,實現2個匹配標簽開發· 統計類標簽開發

  • 新增2022-09-26

    · 基于標簽開發基類重寫統計類標簽和規則類標簽

  • 新增2022-09-20

    · spark實現統計類標簽開發· spark實現規則類標簽開發

  • 新增2022-09-14

    · spark與mysql整合· spark與es整合

  • 新增2022-09-06

    · 用戶畫像數據檢驗的三種方式· 從hive導入數據到es實現· es元數據對象解析

  • 新增2022-08-29

    · es集成hadoop生態圈· es-hive支持· es-hive案例與參數

  • 新增2022-08-23

    · es核心原理與關鍵概念· es的resultful api· python代碼操作es

  • 新增2022-08-17

    · es基礎· 使用es的原因· es的架構

  • 新增2022-08-09

    · 核心業務流程· sparksql分析引擎· 數倉六層模型

  • 新增2022-08-01

    · 自動導入oracle數據 · 自動創建文件目錄· 記錄自動化過程日志

  • 新增2022-08-01

    · 自動導入oracle數據 · 自動創建文件目錄· 記錄自動化過程日志

  • 新增2022-07-25

    · 自動創建hive表· 自動創建hive分區· 自動關聯hdfs數據

  • 新增2022-07-18

    · 數倉建模方法論· 日期維度程序生成· 維度模型選型

  • 新增2022-07-11

    · docker虛擬網橋與網卡· 宿主機與docker容器 · 創建大數據組件容器

  • 新增2022-07-04

    · 行程地理區域維度· 組織機構維度· 服務網點維度

  • 新增2022-06-28

    · 加油站維度· 服務屬性維度· 物流公司維度· 故障維度

  • 新增2022-06-28

    · 加油站維度· 服務屬性維度· 物流公司維度· 故障維度

  • 新增2022-06-21

    · 數倉整體設計圖· 技術選型設計圖· 項目原始數據庫結構圖

  • 新增2022-06-14

    · ODS建模后,使用SQOOP導入數據· DWD根據業務使用全量表、增量表、拉鏈表等不同的方式實現· DWB層的訂單明細表關聯了訂單表、訂單副表、訂單組表、店鋪表、地區表、訂單商品快照表等· 商品明細表關聯了商品表、商品分類表(三層分類)、商品品牌表等

  • 升級2022-06-07

    · 使用新版數據庫,包含完整的訂單、商品、用戶、配送及支付、退款等數據· 實戰提取訂單相關的指標和維度  · Flink多語言開發· Flink監控調優

  • 新增2022-05-31

    · Flink背壓機制· Flink內存管理· Python語言操作Flink

  • 新增2022-05-24

    · FlinkSink新特性· FlinkSQL整合Hive· 分層規范,通過對數據業務的分析,將數倉分為ODS, DWD, DWB, DM, APP五層

  • 新增2022-05-17

    · FlinkSQL&Table理論部分比重,移除過期API,使用新版API · FlinkSQL整合Kafka案例· 雙流Join知識點和案例分層規范,通過對數據業務的分析,將數倉分為OD· S, DWD, DWB, DM, APP五層

  • 新增2022-05-10

    · Flink版本為1.14· 弱化DataSetAPI講解,加強DataStreamAPI-流批一體新特性的講解· 移除過期API,增加DataStream、Window、Watermaker新版API使用講解

  • 新增2022-05-03

    · 實時業務-實時統計Top10熱點題· 實時業務-實時統計答題最活躍的Top10年級· 實時業務-實時統計Top10熱點題及所屬科目

  • 新增2022-04-26

    · 數據模擬程序寫入到Kafka· 實時分析學生答題情況· StructuredStreaming實時分析入口程序· python完成電商行業ETL實戰· ETL基礎概念· ETL完成的Pipeline構建流程

  • 新增2022-04-19

    · 結構化流更新,刪除Rate數據源-文件數據源· 刪除企業不常用SparkStreaming

  • 新增2022-04-12

    · Spark中Continuous Processing· Spark3.2新特性· Spark性能調優九項原則、數據傾斜、shuffle優化· 新增Spark教育行業案例,方便學員掌握RDD和DataFrame的使用

  • 新增2022-04-05

    · StructuredStreaming 處理延遲數據和水印· StructuredStreaming 結構化流數據和靜態數據Join· StructuredStreaming 結構化流數據和結構化路數據Join

  • 新增2022-03-29

    · 離線業務分析-各科目熱點題分析· 離線業務分析-各科目推薦題分析

  • 新增2022-03-22

    · StructuredStreaming 物聯網設備數據分析案例· StructuredStreaming 基于事件時間的窗口

  • 新增2022-03-15

    · SparkSQL底層執行原理· StructedStream結構化流內容· Pandas的教育案例數倉實戰

  • 升級2022-03-08

    · 升級Spark版本到3.2· 升級Spark的主流開發語言為Python· 優化Spark的Standalone方式安裝,使用local和yarn模式· Spark3.2整合Hive3.1.2版本兼容問題

  • 新增2022-03-01

    · MySQL的教育案例數倉實戰· Pandas基礎使用,作為理解Spark數據類型的基礎· Pandas的Series數據結構· 增加在線教育案例

  • 新增2022-02-25

    · Python版本Hbase的API調用· Python的教育案例數倉實戰· StructuredStreaming Sink內容· StructuredStreaming 整合Kafka

  • 新增2022-02-18

    · Flume采集MoMo數據集場景· 實時和離線方式處理數據場景· Python版本Kafka的調用· NoSQL階段多場景項目實戰

  • 新增2022-02-11

    ·Flume1.9數據采集方式· Hbase2.x新特性

    升級

    · Hbase的BulkLoader全量數據加載方式

  • 新增2022-02-04

    ·Python版本MapReduce寫法

  • 新增2022-01-28

    · python腳本實現增量從oracle導入數據到hdfs中· python腳本實現全量從oracle導入數據到hdfs中· python腳本實現上傳avro文件到hdfs上

  • 新增2022-01-21

    · python腳本實現壓縮表的avro文件為tar.gz文件· python腳本實現avro壓縮文件上傳hdfs· python實現讀取oracle表原始數據· python實現創建hive表· python實現創建hive表

  • 新增2022-01-14

    · python實現自定義記錄日志· python實現讀取一行行文本文件工具類· python讀取表信息轉對象方法· python實現sparksql創建數據庫和表· python實現sparksql創建分區關聯表對應的hdfs數據方法

  • 新增2022-01-07

    · python實現sparksql查詢ods層明細數據并加載到dwd層方法· python實現sparksql查詢ods層明細數據并加載到dwd層方法· 造數據平臺· 新特殊字段類型

  • 新增2021-12-24

    · 字段類型· flink源碼前置基礎· 源碼的編譯和部署· flink啟動腳本的解讀· yarn-per-job模式解析

  • 新增2021-12-17

    · flink任務調度機制· flink內存模型· HIve3新特性· Hive3數據壓縮,存儲格式等內容· Hadoop3新特性

  • 新增2021-12-10

    · 概念和通用api介紹· sqlclient工具的使用· catalogs知識點的學習· 流處理中的概念介紹

  • 新增2021-12-03

    · flinksql中的窗口使用(Application Mode)· FlinkSQL函數操作· Flinksql連接到外部系統· flinksql的原理和調優· sql操作參考

  • 新增2021-11-26

    · flink on yarn的第三種部署方式(Application Mode)· 自定義source· transformation算子minby和maxby· transformation算子minby和maxby· flink的global window的操作

  • 新增2021-11-19

    · flink內置水印函數的操作· flink的window的ReduceFunction· flink的window的AggregateFunction· flink的window的ProcessWindowFunction· flink的window的具有增量聚合的ProcessWindowFunction

  • 新增2021-11-12

    · flink的window的在 ProcessWindowFunction 中使用每個窗口狀態· flink的state的ttl機制· flink的state的數據結構的api升級例· flink的Queryable State知識點· 異步io的vertx框架實現

  • 新增2021-11-05

    · flink的join操作· Streaming File Sink連接器的小文件操作· 數據類型及序列化的原理和實現案例· 熱門銷售排行TopN的使用案例· 布隆過濾器結合TTL的使用案例

  • 新增2021-10-29

    · PySpark的安裝· PySpark任務提交方式· PySpark多種模式spark-submit· PySpark多種模式spark-submit

  • 新增2021-10-22

    · Anaconda安裝使用· Python實現RDD的基礎的Transformation操作· Python實現RDD的Action操作· Python實現Sougou分詞案例· Python實現IP熱度分析案例

  • 新增2021-10-15

    · Python實現PV-UV-TOPK案例· Python實現累加器及案例優化· Python實現廣播變量案例及優化· Python實現緩存案例及優化實現· PySparkSQL實現基礎統計操作

  • 新增2021-10-08

    · PySpark實現DataFrame的基礎操作· PySpark實現DataFrame的wordcount操作· PySpark實現DataFrame和RDD的轉換操作· PySpark實現電影評分數據集分析

  • 新增2021-09-24

    · PySpark的底層Dataframe如何轉化為RDD的原理操作· PySparkSQL的優化方式· PySparkSQL分布式引擎實現· PySparkSQL與HIve整合· PySpark離線教育案例

  • 新增2021-09-17

    · PySpark新零售分析案例· ETL、ELT區別· Hive CTE表達式、更新union聯合查詢· 大數據5V特點· 大數據多個應用場景

  • 更新2021-09-10

    · pandas及可視化課程迭代至v2.01· 數據分析多場景項目迭代至v1.81 · 最新版Python基礎編程v2.01· 最新版Python編程進階更新迭代至v2.01· 制定v2.0版本課程大綱

  • 升級2021-09-03

    · 完善flink的運行架構內容· 完善flink與kafka連接器的操作· 完善flink的window操作的講義· 完善ODS層,新增和更新抽取方式,畫圖錯誤

  • 更新2021-08-27

    · Flink版本為1.13最新版· Flink table sql的整體概述 · 項目開發語言為spark官方使用最多的python語言

  • 更新2021-08-20

    · Spark語言為官方使用最多的Python語言· Spark版本為3.1.2發行版,Hive3.1.2版本

  • 優化2021-08-13

    · 升級HDFS讀寫流程原理圖· 升級Hadoop為最新3.3.0版本· 升級編排Linux2天講義升級編排Linux2天講義· 升級Mysql RPM安裝方式以支持hive3

  • 優化2021-08-06

    · 優化Hive知識點案例 同步為Hive3版本· 優化Linux基礎命令,刪除了不常用命令· 優化使用Python實現MR原理機制

  • 優化2021-08-03

    · 優化OLAP、OLTP區別· 優化Hadoop版本安裝及注意事項· 優化Hadoop版本安裝及注意事項· 優化Hive版本為最新的3.1.2版本

  • 優化2021-07-27

    · 優化HIve3.x架構· 優化PySpark執行流程,引入Py4J技術· 優化車聯網Web展示部分· 優化車聯網離線Hive數倉構建部分

  • 新增2021-07-20

    · 新增數倉整體設計圖· 新增技術選型設計圖· 新增項目原始數據庫結構圖

  • 新增2021-07-13

    · 新增油站維度· 新增服務屬性維度· 新增物流公司維度· 新增故障維度

  • 新增2021-07-06

    · 新增行程地理區域維度· 新增組織機構維度· 新增服務網點維度· 新增數倉建模方法論· 新增日期維度程序生成

  • 新增2021-06-29

    · 新增維度模型選型· 新增自動創建hive表· 新增自動創建hive分區· 新增自動關聯hdfs數據· 新增自動導入oracle數據

  • 新增2021-06-22

    · 新增自動創建文件目錄· 新增記錄自動化過程日志· 新增java和數據結構大數據題目4個· 新增算法題目4個· 新增Hadoop題目6個

  • 新增2021-06-15

    · 新增hive題目3個· 新增spark題目7個· 新增flink題目4個· 新增其他大數據組件題目4個· 新增美團大數據架構

  • 新增2021-06-08

    · 新增平安大數據架構解決方案· 新增小米大數據架構解決方案· 新增百度廣告業務場景大數據架構解決方案

  • 新增2021-06-01

    · 新增Flume1.9數據采集方式· 新增Flume采集MoMo數據集場景· 新增實時和離線方式處理數據場景· 新增SparkWebUI功能解釋

  • 新增2021-05-25

    · 新增SparkSQL比重· 新增StructedStream雙流Join知識點· 新增Spark多語言開發-JavaSpark和PySpark

  • 新增2021-05-18

    · 新增SparkMlLib-ALS推薦算法案例和原理· 新增SparkMlLib-線性回歸算法案例和原理· 新增SparkMlLib-決策樹算法案例和原理

  • 新增2021-05-11

    · 新增Spark3.0新特性· 新增Spark性能調優九項原則、N多配置參數、數據傾斜、shuffle優化· 新增IP查詢案例

  • 新增2021-05-04

    · 新增教師案例Spark案例· 新增DataStream、Window、Watermaker新版API使用講解· 新增FlinkSQL&Table理論部分比重,使用新版API· 新增FlinkSQL整合Kafka案例· 新增雙流Join知識點和案例

  • 新增2021-04-26

    · 新增Execl數據分析,整合Execl圖標、透視表等使用· 新增Execl分析項目· 數據儀表板展示· 新增Tableau的BI分析工具及項目實戰

  • 新增2021-04-19

    · 新增數據分析的Python語言· 新增Python基礎語法與高級特性· 新增Python整合SQL的操作及案例· 新增網絡爬蟲數據采集基礎及案例

  • 新增2021-04-12

    · 新增Python高階語法支持· 新增Selenium自動化工具開發· 新增多場景爬蟲項目實戰· 新增Python的Numpy及Pandas數據分析框架

  • 新增2021-04-05

    · 新增Pandas數據清洗,數據整理及案例實戰· 新增Matplotlib等數據可視化操作及案例實戰· 新增Python機器學習原理理解,增加回歸、分類及聚類· 算法原理

  • 新增2021-03-29

    · 新增Python機器學習庫Sklearn多任務實戰· 新增零售行業數據分析及挖掘項目案例· 新增電商行業數據分析及挖掘項目案例

  • 新增2021-03-15

    · 騰訊聊天機器人· 騰訊文字識別· python操作mycat· 小程序開發

  • 新增2021-03-08

    · django_extensions使用· axios網易案例· 阿里云方案· django-channels使用

  • 新增2021-03-01

    · pytest自定義插件使用· pytest異步調用· pytest定時執行· pytest標記使用

  • 升級2021-02-22

    · Cookie和Session使用 · Django類裝飾器· Django多對多查詢· Django關聯查詢

  • 升級2021-02-15

    · 推薦算法 · 數據可視化· sql數據查詢· H5語法

  • 升級2021-02-08

    · 美多狀態保持 · Django框架請求對象獲取數據· Django模版· Django拓展類

  • 新增2021-02-01

    · asyncio編程 · RabbitMQ的Confirm機制· RocketMQ使用· Celery定時任務

  • 增加2021-01-25

    · Angular管道 · Angular路由· Angular使用HTTP· Angular表單

  • 增加2021-01-18

    · Ant Design · TypeScript類型斷言制· TypeScript內置對象· TypeScript代碼檢查

  • 升級2021-01-11

    · Django認證 · Django權限控制· 美多商城發送短信· 美多商場QQ登錄

  • 優化2021-01-04

    · SQL查詢 · 數據倉庫· 業務報表· Pandas

  • 新增2020-12-28

    · 機器學習排序算法 · 購物籃分析· RFM模型· K均值聚類算法

  • 新增2020-12-21

    · 物品畫像 · 用戶畫像· 召回算法· 漏斗分析

  • 升級2020-12-14

    · 狀態保持 · 權限管理· 頁面靜態化· xpath工具

  • 升級2020-12-07

    · 極驗驗證 · jieba分詞· shell代碼發布· 對象存儲

  • 新增2020-11-30

    · ES集群搭建 · IK中文分詞· ES聚合查詢· ES凍結解凍索引

  • 新增2020-11-23

    · Kafka Broker集群 · Topic模型· kafka數據備份· kafka消息持久化

  • 升級2020-11-16

    · pandas的apply方法 · pandas的transform方法· pandas的to_numeric函數· Pandas內置聚合方法

  • 升級2020-11-09

    · elk日志監控 · shell代碼發布· ubuntu版本20.04· 移動端測試

  • 優化2020-11-02

    · mysql讀寫分離 · reids哨兵· redis安全限制· Keepalived非搶占模式

  • 新增2020-10-26

    · VIP腦裂 · MyCAT使用· WA配置使用· redis持久化

  • 新增2020-10-19

    · HA Cluster高可用集群 · Keepalived使用· VRRP協議· nginx服務切換

  • 升級2020-10-12

    · fastDFS使用 · shell使用 · docker使用· nginx使用

  • 升級2020-10-05

    · cookie和session案例 · mysql主從 · mysql集群· redis主從

  • 升級2020-09-28

    · Django用戶權鑒 · Django表單 · Django-froms· Django站點管理

  • 新增2020-09-07

    · Ansible使用 · AWX使用 · ceph使用· zabbix使用

  • 升級2020-08-31

    · 登錄判斷中間件 · cache緩存使用 · 購物車數據存儲· git沖突解決

  • 新增2020-08-24

    · pyautogui使用 · uiautomator使用 · PO模式· mock測試

  • 新增2020-08-17

    · Django轉換器 · Django用戶認證拓展類 · Django權限認證拓展類· Haystack搜索類

  • 升級2020-08-10

    · python操作reids · redis高可用 · redis集群搭建· redis持久化

  • 升級2020-08-03

    · mysql事務使用 · mysql主從搭建 · mysql客戶端使用 · mysql外鍵操作

  • 新增2020-07-27

    · mongodb聚合 · mongodb索引 · mongodb權限· 常見反爬手段

  • 新增2020-07-20

    · 緩存擊穿 · 緩存雪崩 · 雪花算法 

  • 升級2020-07-13

    · Locust 性能測試 shell編程 · msyql數據庫 · redis緩存 ·

  • 升級2020-07-06

    · redis集群 · gitfollow工作流 · 定時爬蟲 · elk

  • 升級2020-06-29

    · 響應對象的處理 · 細化Cookie及Session的處理 · 鏈接失效的爬蟲案例 · 美后臺權限控制

  • 新增2020-06-22

    · 高性能爬蟲 · 多線程爬蟲案例 · Flask-Migrate 數據模型設計 · 智慧大屏案例

  • 升級2020-06-15

    · UnitTest斷言: 比較斷言,復雜斷言 · 路由系統全線升級 · 數據圖片化反爬 · redis緩存

  • 新增2020-06-08

    · Jmter 圖形監視器擴展插件 · 警告斷言 · 異常斷言 · Jmter性能調試

  • 新增2020-06-01

    · 性能測試報告分析 · 新增分庫訪問 · 優化Fixtures的參數化 · protometheus使用

  • 新增2020-05-25

    · flask-sqlalchemy二次開發 · 數據解析-BeautifulSoup4 · Jmeter分布式并發測試的配置 · zabbix使用

  • 新增2020-05-18

    · Jmeter實現參數化 · 數據庫測試 · 實現跨線程組傳值 · lua基礎

  • 新增2020-05-11

    · 自定義讀寫分離 · 認證體系 · 訪問劫持 · 安全策略

  • 新增2020-05-04

    · Redis悲觀鎖 · 布隆過濾器 · 文件安全 · WAF實踐

  • 升級2020-04-27

    · 搜索接口結構 · elsticsearch使用 · celerybug處理 · rabbitMQ使用

  • 升級2020-04-20

    · Locust關聯 · Locust斷言 · Locust各種業務場景下的參數化 · pipeline使用

  • 升級2020-04-13

    · 更改Scrapy以及Scrapy-redis項目 · Selenium知識點演示案例 · redis哨兵機制 · mysql主從搭建

  • 升級2020-04-06

    · 時間戳/頁碼/偏移量分頁 · gitflow工作流 · sentry使用 · xss安全

  • 新增2020-03-30

    · Pytest.mark · flask緩存工具類 · 多級緩存 · mysql注入攻擊

  • 新增2020-03-23

    · 禪道的不同角色使用 · Mysql垂直拆分 · Flask-SQLAlchemy的讀寫分離 · Mysql水平拆分

  • 升級2020-03-16

    · 性能測試分類 · 性能監控指標 · 性能測試流程 · celery使用

  • 新增2020-03-09

    · 定時抓取數據爬蟲 · Appium對APP數據的抓取 · 常見性能測試工具優化 · Filebeat詳解

  • 升級2020-03-02

    · 禪道的部署方式 · django框架升級為2.25版本 · 美多詳情頁靜態化 · 商品spu表結構

  • 新增2020-01-16

    · 美多商城緩存 · elk日志監控 · docker部署美多商城 · shell代碼發布

  • 升級2020-01-09

    · 等價類劃分法演示案例 · 邊界值法的演示案例 · 容聯云發送短信 · fastDFS圖片上傳

  • 新增2020-01-02

    · 測試用例的設計方法 · 獲取用戶信息模塊的單元測試 · 登錄注冊模塊的單元測試 · jenkins使用

  • 升級2019-12-26

    · Django自帶單元測試模塊 · Mysql數據庫教法調整 · 黑馬頭條緩存使用 · dockerfile使用

  • 新增2019-12-19

    · Locust 性能測試 · HttpLocust和Locust · TaskSet TaskSequence · seq_task

  • 升級2019-11-28

    · 異常案例的講解 · 代碼健壯性提升方式 · 登錄狀態判斷 · 異常處理

  • 升級2019-11-21

    · 商品模塊代碼進行了調整 · Redis事務型管道 · 反爬案例 · 搜索方法優化

  • 新增2019-11-14

    · 新增字體反爬 · Charles/fiddler抓包工具講解 · Redis非事務型管道 · 新增shell編程

  • 升級2019-11-07

    · PO模型 · Requests模塊的使用 · Get/Post等Http請求 · 試用例的設計方法

  • 新增2019-10-31

    · Flask項目搭建Flask-CORS · Fixtures實現SetUp和TearDown · 美多商城登錄功能自動化測試 · Redis緩存數據集合

  • 升級2019-10-24

    · 黑馬頭條前端代碼 · 分布式事務 · 美多商城前臺改為前后端分離模式 · admin后端管理站點講解

  • 新增2019-10-17

    · 美多商城支付模塊單元測試 · Jmeter 性能測試報告 · TestCase Client FactoryRequest Mock · 美多商城下單模塊性能測試

  • 新增2019-10-10

    · 黑馬頭條業務邏輯: 用戶認證 、修改頭像 · 黑馬頭條業務邏輯: 頻道管理 · 黑馬頭條業務邏輯: 文章列表/詳情 · 黑馬頭條業務邏輯: 關注用戶 評論回復

prev next
點擊加載更多>>
2024.07.20 升級版本5.0

課程名稱

AI+Python大數據開發課程

課程推出時間

2024.07.20

課程版本號

5.0

技術課程

Hadoop3.3,Spark3.4,阿里云Flink(FlinkCDC、FlinkCEP、FlinkSQL),Hudi,Doris,Starrocks,Paimon,ElasticSearch

課程介紹

AI+Python大數據開發V5.0課程全新升級,全面擁抱AI大模型,采用AI+編程助力數據開發提效,緊貼各類企業招聘需求,升級面向數據分析的AI Agent智能體實現高效數據開發,升級阿里云平臺全套基于云平臺的大數據技術棧,全程采用六項目制驅動技術學習,助力國家數字化轉型對數字人才的大量需求。

V5.0 五大課程優勢

優勢1:AI大模型全程賦能,讓數據分析更精準,開發更高效;優勢2:1000+核心業務指標,多行業高效通用;優勢3:前沿解決方案拿來即用,開發不必從零開始;優勢4:聯合阿里云共建課程, 助力企業“上云”便捷開發;優勢5:課程設置全面,熱門數據崗位全覆蓋 。

● AI大模型全程賦能,讓數據分析更精準,開發更高效(1、AI提高學習效率:全部技術階段融入AI編程;2、AI提高項目開發效率:全階段項目融入AI編程;3、AI提高閱讀代碼效率:復雜Spark算子的底層源碼解讀;4、通過AI提高刷題效率:學員能夠用使用AI大模型進行數據開發方向面試題問答,讓刷題更高效)。

● 多位Apache社區貢獻者聯袂授課,從原理、實戰到源碼,帶你邁入高級開發工程師行列。

● 課程覆蓋企業級大數據六大主流解決方案,包括離線數倉解決方案、基于StarRocks統一數倉解決方案和基于云平臺的湖倉一體解決方案、用戶畫像解決方案、推薦系統解決方案、數據治理解決方案,再現公司中真實的開發場景,目標不止于就業,而是成為各類企業爭搶的大數據開發工程師。

● 課程升級主流企業級數倉解決方案,包括基于StarRocks統一數倉解決方案和基于云平臺的湖倉一體解決方案,不僅可以學習到企業真實完整的業務場景,將六大技術解決方案應用到黑馬甄選泛電商業務中,能勝任企業級離線數倉、實時數倉、用戶畫像、推薦系統、數據治理等核心大數據開發工作。

● 繼V4.5版本推出黑馬甄選離線數倉業務之后,V5.0版本增加了黑馬甄選用戶畫像和推薦系統的全套解決方案課程,課程采用由淺入深,層層遞進的講解方式, 讓學生輕松掌握企業級用戶畫像系統的設計與開發全流程,項目使用的技術棧包括Spark、ES、Doris、SeaTunnel、Kafka均為時下主流的大數據技術,項目使用Structured Streaming開發實時類標簽,使用SeaTunnel做數據同步,使用ES和Doris存儲結果數據及使用Spark MLlib開發推薦系統。該項目構建適合全場景的用戶畫像+推薦系統解決方案。

1

新增面向數據分析的AI Agent智能體實現高效數據開發,提升數據分析和查詢效率。滿足就業市場中數據工程師+AI大模型技能的需求,提升學生就業競爭力。

1

新增基于StarRocks統一數倉解決方案,提升數據分析和查詢效率。滿足就業市場中中高級數據工程師需求,提升學生就業競爭力。

1

新增基于云平臺的湖倉一體解決方案,項目采用阿里云Flink結合Paimon,完成實時計算和流批一體存儲,采用DataWorks+MaxCompute完成離線數倉開發,使用DataWorks完成數據治理等內容,該方案對各行業大數據平臺建設都有極強借鑒意義。讓學員具備基于阿里云DataWorks、MaxComputer及Flink等技術能力要求,增加學員的就業選擇范圍。

1

新增黑馬甄選用戶畫像和推薦系統的全套解決方案課程,,采用大規模Spark機器學習和個性化推薦技術,達到企業級提供一站式推薦服務能力搭建平臺,提升學生就業競爭力

1

優化Paimon、Hudi新技術,將技術應用到實時項目中,更加全面提升通過技術解決業務問題能力。

1

優化新版面試加強課,內容集成了大廠架構解析、SQL專項面試寶典,以及不斷滾動更新的全網大數據崗位面試題講解,助力學員高起點就業。

1

優化大數據BI報表開發項目實戰階段,通過Python+SQL+FineReport完成電商業務統計分析和大屏展示。

1

友情提示更多學習視頻+資料+源碼,請加QQ:2632311208。

2024.04.21 升級版本4.5

課程名稱

Python+大數據開發課程

課程推出時間

2024.04.21

課程版本號

4.5

技術課程

Hadoop3.3,Spark3.4,阿里云Flink(FlinkCDC、FlinkCEP、FlinkSQL),Hudi,Doris,Starrocks,Paimon,ElasticSearch

課程介紹

● Python大數據V4.5課程全新升級,緊貼各類企業招聘需求,升級阿里云平臺全套大數據技術棧,全程采用六項目制驅動技術學習,助力國家數字化轉型對數字人才的大量需求。

● 多位Apache社區貢獻者聯袂授課,從原理、實戰到源碼,帶你邁入高級開發工程師行列。

● 課程覆蓋企業級大數據六大主流解決方案,包括離線數倉解決方案、流批一體解決方案和湖倉一體解決方案、用戶畫像解決方案、推薦系統解決方案、數據治理解決方案,再現公司中真實的開發場景,目標不止于就業,而是成為各類企業爭搶的大數據開發工程師。

● 課程升級主流大數據技術棧,全新Hadoop3.3,Spark3.4,阿里云實時計算Flink技術剖析和新特性使用,推出黑馬甄選業務的全套解決方案課程,不僅可以學習到企業真實完整的業務場景,將六大技術解決方案應用到黑馬甄選泛電商業務中,能勝任企業級離線數倉、實時數倉、用戶畫像、推薦系統、數據治理等核心大數據開發工作。

1

新增數據治理解決方案,結合包括元數據管理、數據標準、指標系統、數據建模等在內的數據治理能力,聚焦企業數字化轉型,深挖數據價值,提升企業數據生產力。滿足就業市場中中高級數據工程師需求,提升學生就業競爭力。

1

新增數據分析相關的課程內容,讓學員具備數據分析崗位的能力要求,增加學員的就業選擇范圍。

1

新增多場景離線數倉項目解決方案,基于Starrocks數據庫完成數倉的搭建,結合多場景的業務豐富學生對業務理解能力。

1

優化推薦系統解決方案,采用大規模機器學習和個性化推薦技術,達到企業級提供一站式推薦服務能力搭建平臺,提升學生就業競爭力。

1

優化Paimon、StarRocks新技術,將技術應用到實時項目中,更加全面提升通過技術解決業務問題能力。

1

優化新版面試加強課,內容集成了大廠架構解析、SQL專項面試寶典,以及不斷滾動更新的全網大數據崗位面試題講解,助力學員高起點就業。

1

優化黑馬甄選實時計算項目由阿里云實時計算Flink全棧開發,從FlinkCDC數據采集,Kafka實時數倉分層,Paimon數據湖構建湖倉一體架構,將數據接入Starrocks進行OLAP分析和查詢,最后通過DataV完成企業級業務大屏展示。

1

優化大數據BI報表開發項目實戰階段,通過Python+SQL+FineReport完成電商業務統計分析和大屏展示。

2023.08.21 升級版本4.0

課程名稱

Python+大數據開發課程

課程推出時間

2023.08.21

課程版本號

4.0

技術課程

Hadoop3.3,Spark3.4,阿里云Flink(FlinkCDC、FlinkCEP、FlinkSQL),StarRocks,Paimon,ElasticSearch

課程介紹

● Python大數據V4.0課程全新升級,緊貼各類企業招聘需求,升級阿里云平臺全套大數據技術棧,全程采用六項目制驅動技術學習,助力國家數字化轉型對數字人才的大量需求。

● 多位Apache社區貢獻者聯袂授課,從原理、實戰到源碼,帶你邁入高級開發工程師行列。

● 課程覆蓋企業級大數據六大主流解決方案,包括離線數倉解決方案、流批一體解決方案和湖倉一體解決方案、用戶畫像解決方案、推薦系統解決方案、數據治理解決方案,再現公司中真實的開發場景,目標不止于就業,而是成為各類企業爭搶的大數據開發工程師。

● 課程升級主流大數據技術棧,全新Hadoop3.3,Spark3.4,阿里云實時計算Flink技術剖析和新特性使用,推出黑馬甄選業務的全套解決方案課程,不僅可以學習到企業真實完整的業務場景,將六大技術解決方案應用到黑馬甄選泛電商業務中,能勝任企業級離線數倉、實時數倉、用戶畫像、推薦系統、數據治理等核心大數據開發工作。

● 項目課程實施“講A練B”與"看圖說話"新模式, 以思路分析為導向提高學員獨立開發能力,并推動學員在邏輯思維與語言表達能力方向的持續提升,為學員在面試中以及在企業獨立開發中打下堅實的基礎

1

新增數據治理解決方案,結合包括元數據管理、數據標準、指標系統、數據建模等在內的數據治理能力,聚焦企業數字化轉型,深挖數據價值,提升企業數據生產力。滿足就業市場中中高級數據工程師需求,提升學生就業競爭力。

1

新增通過AIGC助力編程效率提升,完成數據開發和數據分析任務。

1

新增Paimon、StarRocks新技術,將技術應用到實時項目中,更加全面提升通過技術解決業務問題能力。

1

新增新版面試加強課,內容集成了大廠架構解析、SQL專項面試寶典,以及不斷滾動更新的全網大數據崗位面試題講解,助力學員高起點就業。

1

更新由Apache Flink1.17課程升級為阿里云實時計算Flink版,通過阿里云全套大數據組件學習,貼近中小型企業大數據開發真實環境,提升學生就業競爭力。

1

新增黑馬甄選實時計算項目由阿里云實時計算Flink全棧開發,從FlinkCDC數據采集,Kafka實時數倉分層,Paimon數據湖構建湖倉一體架構,將數據接入Starrocks進行OLAP分析和查詢,最后通過DataV完成企業級業務大屏展示。

1

新增大數據BI報表開發項目實戰階段,通過Python+SQL+FineReport完成電商業務統計分析和大屏展示。

1

2023.01.01 升級版本3.2

課程名稱

Python+大數據開發課程

課程推出時間

2023.01.01

課程版本號

3.2

主要使用開發工具

PyCharm,IDEA,DataGrip,FinalShell

課程介紹

● 優勢1:課程升級深度調研市場需求,針對行業解決方案:離線數倉解決方案、用戶畫像解決方案、湖倉一體解決方案,打造多行業多場景大數據開發工程師。

● 優勢2:6項目制,2大項目實戰,新增PB級內存計算項目實戰,應對企業級大數據開發工程師需求。

● 優勢3:研究院精心研發基于實時技術棧全新架構的出行行業和電商行業大數據項目,讓學生具備更強項目經驗要求。

● 優勢4:最短路徑教會企業最實用的技術,案例練習促進吸收;每日作業夯實學習成果;階段項目實戰,學以致用。

1

新增基于Flink的悠游出行大數據平臺

1

新增基于Flink的優購電商優選項目

1

新增用戶畫像解決方案項目,包含了新零售、電商、金融保險等多行業畫像解決方案

1

升級Spark內存計算階段項目實戰

1

新增大數據Java語言基礎,為Flink技術棧提供語言支持

1

新增SQL大廠面試題,貫穿課堂每日一練,提升SQL技術能力

1

新增Hudi數據湖,Hudi on Hive構建湖倉一體架構

1

新增Python版NoSQL課程,達到企業級萬億級數據存儲目標

1

新增Doris、ClickHouse多維數據分析

1

優化億品新零售項目中數倉建模理論基礎,強化數倉建模工具使用

1

優化車聯網項目全新架構升級

1

優化Flink技術課程版本更新至1.16,豐富實時計算新特性

1

優化Spark技術課程版本更新至3.3.0,增加Spark新特性講解

1

優化優化Hadoop模塊,增強Hive模塊

1

優化優化Python編程內容,為Spark提供語言支持

1

優化ETL項目增加從HDFS到Hive的數據抽取、轉換、加載方式

1

優化ETL項目增加DataX數據采集

1

優化ETL項目增加Apache DolphinScheduler調度全流程數據處理過程

1

優化Flink技術棧突出以FlinkSQL為主核心技術

2022.06.01 升級版本3.0

課程名稱

Python+大數據開發課程

課程推出時間

2022.06.01

課程版本號

3.0

主要針對

          技術課程:ETL開發、NoSQL中間件課程、新版Flink課程

主要使用開發工具

PyCharm、DataGrip、FinalShell

課程介紹

● Python大數據V3.0課程全新升級,緊貼各類企業招聘需求,采用六項目制驅動技術學習,助力國家數字化轉型對數字人才的大量需求

● 多位Apache社區貢獻者聯袂授課,從原理、實戰到源碼,帶你邁入高級開發工程師行列

● 課程覆蓋企業級大數據四大主流解決方案,包括離線數倉解決方案、用戶畫像解決方案、流批一體解決方案和湖倉一體解決方案,再現公司中真實的開發場景,目標不止于就業,而是成為各類企業爭搶的大數據開發工程師。

● 課程升級主流大數據技術棧,全新Hadoop3.2,Spark3.2,Flink1.15技術剖析和新特性使用,推出Python全棧ETL開發課程,不僅可以學習到完整的基礎ETL流程、工具,更能勝任千億級、亞秒級等復雜數據源情況下的工作。

● 新增基于Python和SQL的Flink課程,滿足就業市場中,大數據開發崗位更多的依賴SQL、Python的需求變化。

● 新增 基于Python的Kafka、Elasticsearch等全新課程,夯實實時計算開發基礎能力,幫助學員掌握數據開發工程師重要技能。

● 新增 新版面試加強課,內容集成了大廠架構解析、SQL專項面試寶典,以及不斷滾動更新的全網大數據崗位面試題講解,助力學員高起點就業。

1

新增基于Python的全棧ETL開發課程,助力學員勝任ETL中高級開發崗位

1

新增全網基于PySpark技術棧的用戶畫像項目,替換原有舊項目,提升簡歷含金量

1

新增知行教育項目實戰,學習完整企業級項目實戰流程,讓學生真正掌握大數據開發精髓

1

升級Spark技術課程為20223.2版本、Flink技術課程為20221.15版本,全網率先加入Pandas on Spark數據開發內容

1

新增FlinkSQL湖倉一體項目、FlinkSQL流批一體課程,進階Flink高階工程師,助力突破年薪50W

1

新增SparkSQL底層執行原理,StructuredStreaming結構化流內容

1

升級Spark3.2整合Hive3.1.2版本兼容問題

1

新增Pandas_udf函數,通過Apache Arrow框架優化數據處理速度;Pandas技術棧,能夠處理中小型數據量

1

新增Python版NoSQL課程,達到企業級萬億級數據存儲目標

1

新增Kafka-Python完成企業級消息隊列流量削峰, 異步通信等任務

1

新增ElasticSearch技術棧,達到企業級大數據搜索工程師目標

1

升級PySpark的DataFrame操作、Flink任務調度機制以及Flink內存模型、Flink table&sql的整體概述

1

新增FlinkSQL的原理和調優、Flink on Yarn的多種部署方式、Flink transformation的八大物理分區的原理和實現、Flink的window窗口操作,以及內置水印函數的操作

1

新增Hadoop3.x新特性、Hive3.x新特性,以及數據壓縮、存儲格式等內容

1

升級Python基礎,增加PyEcharts等BI內容,實現可視化大屏

1

新增Presto對接多數據源實現企業級大數據OLAP分析、Presto加速對Hive數倉之上數據構建大數據分析引擎,實現多維指標計算

1

新增企業級BI工具FineBI,適用于多行業項目BI大屏展示,助力企業數字決策

1

新增Flink table&sql概念和通用api介紹、sqlclient工具的使用、catalogs知識點的學習、流處理中的概念介紹

1

新增FlinkSQL中的窗口使用、FlinkSQL函數操作、Flinksql連接到外部系統

1

新增Flink源碼前置基礎、源碼的編譯和部署、Flink啟動腳本的解讀、yarn-per-job模式解析

1

升級車聯網Web展示部分、車聯網離線Hive數倉構建部分

2021.06.01 升級版本2.0

課程名稱

Python+大數據開發課程

課程推出時間

2021.06.01

課程版本號

2.0

主要針對

新零售數倉項目、云上服務器集群

主要使用開發工具

新零售數倉項目、云上服務器集群

課程介紹

● 經過不斷的版本迭代,正式推出新零售數倉項目課程,替換原有的舊項目,打造過硬的項目實戰經驗

● 新增價值百萬的UCcloud云上集群生產環境用于學習,完全云服務開發環境體驗

● 新增項目實戰環節,再現企業中真實工作場景,夯實開發實戰能力

1

升級PySpark執行流程

1

新增Spark3.x新特性以及性能調優九項原則

1

升級Hive版本為新的3.x版本

1

新增自動導入oracle數據,自動創建hive表,自動創建hive分區,自動關聯hdfs數據,自動創建文件目錄,并記錄自動化過程日志

1

升級Flink版本為新版

1

新增FlinkSQL&Table理論部分比重,使用新版API,使用新增FlinkSQL整合Kafka案例

1

新增美團、平安、小米大數據架構,以及百度廣告業務場景大數據架構解決方案

1

新增flink的global window的操作、內置水印函數的操作

1

升級 flink的window的ReduceFunction、AggregateFunction、ProcessWindowFunction、具有增量聚合的ProcessWindowFunction、在 ProcessWindowFunction 中使用每個窗口狀態

1

新增flink的state的ttl機制、state的數據結構的api升級、Queryable State知識點

1

新增Flink異步io的vertx框架實現、flink的join操作(Tumbling Window Join、Sliding Window Join、Session Window Join)

1

新增Streaming File Sink連接器的小文件操作

1

新增數據類型及序列化的原理和實現案例

1

新增Flink Action綜合練習:熱門銷售排行TopN的使用案例、布隆過濾器結合TTL的使用案例

2021.01.01 升級版本1.6

課程名稱

Python+大數據開發課程

課程推出時間

2021.01.01

課程版本號

1.6

主要針對

Spark3.x

主要使用開發工具

Pycharm、Idea、Datagrip、FinalShell

課程介紹

● 針對Spark3.x版本的重大更新,應對就業崗位需求的快速變化,大數據課程推出基于Python的Spark課程

● 新增大數據工程師必備的SQL面試進階強化內容,提升大數據開發工程師核心SQL能力

● 新增大廠數倉架構專題內容,提升數據倉庫建設能力

1

升級Hadoop為3.3.0版本、Hive版本為3.1.2版本、HIve3.x架構

1

新增使用Python實現MR原理機制、OLAP、OLTP區別

1

新增MapReduce計算PI原理、MapReduce Python接口調用、Hadoop Streaming提交程序、ETL、ELT區別

1

新增HIve3新特性、Hive3數據壓縮,存儲格式、Hive CTE表達式

1

升級union聯合查詢、Hive知識點案例 同步為Hive3版本、Linux課程、Mysql RPM安裝方式以支持hive3

1

升級Spark語言為官方推薦使用的Python語言、版本更新為Spark3.1.2發行版、adoop3.3.0、Hive3.1.2版本

1

新增PySpark的安裝、任務提交方式、多種模式spark-submit、實現wordcount案例實戰

1

新增Python實現RDD操作、DataFrame操作、實現Sougou分詞案例、IP熱度分析案例、PV-UV-TOPK案例

1

新增PySparkSQL實現基礎統計操作、底層Dataframe轉化RDD原理操作、實現電影評分數據集分析、離線教育案例、新零售分析案例

1

新增PySparkSQL的優化方式、分布式引擎實現、與HIve整合

2020.06.01 重磅推出 新版1.0

課程名稱

Python+大數據開發課程

課程推出時間

2020.06.01

課程版本號

1.0

主要針對

大數據引入Python語言、Pandas數據分析

主要使用開發工具

Pycharm、Idea、Datagrip

課程介紹

● 8.1版本以前的數據開發課程,需要一定Java基礎和工作經驗,為了幫助進入數據開發行業的零基礎學員找到適宜的入門途徑,大數據引入Python語言,全新升級為Python+大數據開發1.0版本。

● 學習Python大數據開發,以Python技術棧處理中小型數據集,以大數據技術棧處理海量大規模數據,成為全能企業級數據開發人才。

● 其特點適合零基礎學員,從完全沒有編程經驗開始;課程內容寬并且深,技術大牛親自授課;面向市場,學即可用,能讓學員高薪就業。

1

新增Python基礎語言課程

1

新增Python高級語言進階課程

1

新增Python爬蟲課程

1

新增Pandas數據分析課程

1

新增多場景案例分析,應對中小型數據統計分析

2020.01.01 升級版本8.0

課程名稱

云計算大數據實戰班

課程推出時間

2020.01.01

課程版本號

8.0

主要針對系統

Windows、Linux、MacOS

主要使用開發工具

DataGrip、IDEA

課程介紹

● 根據大量的行業調研分析,本次課程更新以大數據開發為主線,在7.0基礎上再次縮減Java課程占比,弱化各類組件安裝。

● 針對大數據技術深度和廣度進行升級,例如新增Spark內存管理、Flink性能優化及反壓、背壓原理等同時為提高學員的就業薪資,推出多行業項目解決方案,例如證券、物流等。

● 以周為單位進行課程更新升級,新增Elastic Stack、 出行、電商、視頻、社交等領域大數據解決方案、 一線大廠技術架構、 新零售大數據項目實戰,離線實時全覆蓋。

1

新增數據倉庫、ETL、BI開發

1

新增Oracle及PLSQL編程、數據微服務開發

1

新增Spark的內存管理、avro序列化數據源

1

新增continuous processing、偏移量管理機制

1

新增KafkaStreams編程、exactly-once、Kafka事務、metrics監控

1

新增Hbase的協處理器和phoneix的二級索引實現、布隆過濾器、LSM樹、StoreFiles結構剖析

1

新增FLink性能優化及反壓、背壓指標計算原理、FlinkSQL On Hive、Flink HistoryServer、Flink的UDF、UDAF、UDTF的實現

1

新增在線教育行業、物流行業、物聯網行業、證券行業項目

1

升級分布式緩存系統, 萬億級NoSQL海量數據存儲, 分布式流處理平臺、電商行業項目

1

刪除刪減 JavaWeb

2019.07.22 升級版本7.0

課程名稱

云計算大數據實戰班

課程推出時間

2019.07.22

課程版本號

7.0

主要針對版本

CDH5.14、Spark2.2.0、Flink1.8、Kafka0.11.0.2、ELK6.0

主要使用開發工具

IntelliJ IDEAA

課程介紹

● 大數據技術目前在企業里面使用的越來越廣泛,對大數據人才的需求越來越多,大數據的整個課程體系是由來自大型互聯網、外企等具有5年以上的一線大數據高級工程師、架構師和高級機器學習工程師設計出來的,內容含金量非常高。

● 課程體系涉及的技術以企業需求為導向,課程涉及的項目也是企業里面真實的項目,通過理論、實踐和真實的項目相結合,讓學員能夠快速、深刻的掌握大數據常用的核心技術和開發應用,同時可以滿足企業對中、高端大數據人才的需求。

● 大數據課程體系除了包含常用的Hadoop、Hive、Hbase、ELK、Sqoop、Flume、Kafka、Spark等技術和項目,還新增了目前互聯網比較流行的Flink、Druid、Kylin等技術和項目,同時引入了機器學習和深度學習Spark Mllib和Tensorflow等技術和項目實戰。

1

新增Impala即席查詢組件、Kudu列存儲服務、Structured Streaming結構化數據流處理

1

新增spark MLlib數據挖掘、spark graphX圖計算

1

升級Flink的基礎課程和案例實戰

1

新增Flink高級特性CEP、Kylin數據OLAP分析、Druid時序數據實時分析、Kettle數據ETL工具

1

新增深度學習框架Tensorflow

1

新增用戶畫像、數據倉庫大型企業實戰型項目

2018.09.10 升級版本6.0

課程名稱

云計算大數據實戰班

課程推出時間

2018.09.10

課程版本號

6.0

主要針對版本

JDK1.8\CDH2.7.4\Storm1.1.1\Spark 2.1

主要使用開發工具

IntelliJ IDEA

課程介紹

● 本課程是基于V5.0的一次重大更新,匯總并收集了大數據學科一年以來15個零基礎班級的授課信息、學習信息、就業信息。

● 重新調整了課程的分布情況,新增了大數據綜合項目,新增了第四代大數據處理框架FLink,新增了數據庫優化,新增了JVM基礎及原理,新增了Spark性能調優等內容。

● 課程升級方面,主要對機器學習課程進行了升級,推薦系統項目后置變成7天的豐富課程,提升學員進入機器學習的競爭力,從而更好的從事人工智能領域相關的工作。

● 整體而言,課程在培養中高級大數據工程師的方向上又前進了一大步。

1

新增Hadoop 2.7.2\Storm1.1.1\Spark 2.1

1

新增Java virtual machine原理分析、Java高并發核心知識

1

新增數據庫優化及調優、第四代大數據處理框架Apache Flink、Spark原理深入剖析及生產調優

1

新增互聯網反欺詐項目實戰、廣告系統業務模型及CTR預估

1

新增用戶畫像、數據倉庫大型企業實戰型項目

1

升級用戶畫像概述/數據/建模/算法實戰、推薦系統協同過濾算法實戰、基于內容的推薦系統實戰、基于關聯規則推薦系統實戰

1

升級混合推薦與CTR點擊預估

1

升級Hadoop版本為CDH

2017.07.01 升級版本5.0

課程名稱

云計算大數據實戰班

課程推出時間

2017.07.01

課程版本號

5.0

主要針對版本

JDK1.8\Hadoop 2.7.2\Storm1.1.1\Spark 2.1

主要使用開發工具

Eclipse、IDEA

課程介紹

● Java基礎、JavaWeb核心編程、JavaWeb三大框架、網絡爬蟲、分布式電商網站開發等課程模塊。培養學生編程能力,讓零基礎學員能夠更好的學習大數據項目。

● 大數據方面方面,新增點擊流日志收集系統、用戶日志分析報表系統、用戶畫像系統等案例。讓學員不僅僅學習到大數據技術點,能夠使用大數據解決實際問題。

● 擴充機器學習課程為10天。該課程歷時一年研發,深入淺出,能夠讓學員更好的入門機器學習,成為人工智能開發的初級工程師。

1

升級Hadoop 2.7.2\Storm1.1.1\Spark 2.1

1

新增網絡爬蟲開發

1

新增三大框架開發

1

新增JavaWeb核心

1

新增Java語言基礎

2016.03.01 升級版本4.0

課程名稱

云計算大數據實戰班

課程推出時間

2016.03.01

課程版本號

4.0

主要針對版本

JDK7.x

主要使用開發工具

Eclipse、IDEA

課程介紹

● 對比原有課程,本次課程做了重大更新,將大數據的核心技術hadoop及其生態圈技術完美的融入到了課程中。

● 課程分階段的進行案例實戰和項目實戰,在大數據方面知識體系更加完整,課程更加深度有深度,更加貼近實戰。

● 分階段的進行大數據生態圈的學習,將生態圈分為離線處理,實時流計算和實現火熱的spark內存計算,完美的將生態圈進行了抽離和歸類,讓學習變得更便捷。

1

升級Spark1.6版本

1

新增Linux操作系統和shell腳本學習

1

新增JVM內存模型分析、NIO、Netty、自定義RPC框架

1

新增電商點擊流日志分析、電商實時日志告警平臺、交易風控風控平臺、流量日志分析分析

1

新增Spark游戲日志分析項目

1

刪除KVM虛擬化技術、網絡基礎和OpenvSwitch技術、Ceph存儲技術

1

刪除CloudStack云管理平臺、混合云管理平臺項目

2015.05.15 升級版本3.0

課程名稱

云計算大數據實戰班

課程推出時間

2015.05.15

課程版本號

3.0

主要針對版本

JDK7.x

主要使用開發工具

Eclipse、IDEA

課程介紹

● 本次更新將大數據和虛擬化這兩大熱門技術加入到課程體系中,在大數據方面知識體系更加完整,課程更加深度有深度,更加貼近實戰。

● 在虛擬化方面,選擇了在云計算領域常用的虛擬化、網絡、存儲等技術,并通過Apache CloudStack技術整合,在此基礎上開發混合云管理平臺。

1

升級Hadoop2.0版本、Hive優化課程

1

新增電信流量運營分析項目、混合云管理平臺項目

1

新增Scala函數式編程、Spark內存計算、KVM虛擬化技術

1

新增網絡基礎和OpenvSwitch技術

1

新增Ceph存儲技術、CloudStack云管理平臺

2014.02.15 升級版本2.0

課程名稱

云計算大數據實戰班

課程推出時間

2014.02.15

課程版本號

2.0

主要針對版本

JDK6.x

主要使用開發工具

Eclipse

課程介紹

● 隨著近年來云計算大數據的大力發展,市場對相關人才需求急增,所以本版課程在原有的云計算課程進行了顛覆性的改革,把原來只有1天的課程擴展為7天,加入了Hadoop生態圈的相關技術。

1

升級云計算課程、Hadoop集群部署、優化HDSF、MapReduce案例

1

新增Hadoop生態圈相關技術:Zookeeper、Hive、Hbase、Sqoop、Flume

1

新增Storm實時計算技術和案例

1

新增黑馬論壇日志分析項目

2012.02.15 升級版本1.0

課程名稱

云計算大數據實戰班

課程推出時間

2012.02.15

課程版本號

1.0

主要針對版本

JDK6.0

主要使用開發工具

Eclipse

課程介紹

● 近期云計算概念火爆異常,傳智教育敏銳的嗅探到大數據技術的悄然興起,并預測大數據技術將會像雨后春筍一樣快速發展,所以傳智教育與時俱進在課程中引入了1天的云計算課程,作為擁有大數據課程的培訓機構,傳智教育大數據實戰班助力學員可以掌握新的技術,拓寬學員的就業方向,增強就業競爭力。

1

新增云計算課程:云計算和大數據相關概念

1

新增Hadoop 1.0偽分布式環境部署

1

新增HDFS、MapReduce應用案例

                                                       

授課經驗豐富的Python+大數據開發講師團隊

教師錄取率<3%,從源頭把控師資,帶你過關斬將掌握每一個知識點

貫穿學習全程、保障學習效果的AI教輔系統

用數據驅動教學,貫通教/學/練/測/評,為每一位學員私人定制學習計劃和就業服務

  1. 學前入學多維測評

  2. 學前目標導向式學習

  3. 學中隨堂診斷糾錯

  4. 學中階段效果測評

  5. 學后在線作業試題庫

  6. 學后問答社區查漏補缺

  7. 保障BI報表數據呈現

  8. 就業面試指導就業分析

更多Tlias就業服務

就業流程
全信息化處理

學員能力
雷達圖分析

定制個性化
就業服務

技術面試題
講解

就業指導課
面試項目分析

HR面試攻略

模擬企業
真實面試

專業簡歷指導

面試復盤輔導

風險預警
企業黑名單提醒

打造學員職業生態圈

老學員畢業后即可加入傳智匯精英社區,持續助力學員職場發展

傳智教育旗下IT互聯網精英社區,以匯聚互聯網前沿技術為核心,以傳遞、分享為己任,聯合經緯創投、創新工場、京東人工智能、華為等眾多關注互聯網的知名機構及企業、行業大咖,共同研究中國互聯網深度融合、跨界滲透、整合匯聚、相互促進的信息化資源共享平臺。

  • 行業沙龍

  • 高端人脈

  • 職場資源

  • 技術研習

學長學姐面對面聊就業

查看更多經驗 >
  • 北京學長17k/月

    文科生轉行學計算機,薪資爆炸式提升

  • 北京學長18k/月

    贏麻了!選擇黑馬學大數據,一舉拿下銀行offer

  • 北京學長19.5k/月

    計算機小白的成長之路,學長有話說

  • 北京學長24k/月

    零基礎的我,如何拿下24koffer

  • 北京學長15k/月

    30而已,怕啥!年薪22W學長轉行大數據面試經!

  • 黑馬學長20k/月

    我是怎么拿下20k的?學長面試經驗分享

  • 上海學長17k/月

    "汽車評估師"跨行大數據,選對職業很重要!

  • 上海學長24k/月

    從工廠到大廠,裸辭后憑實力逆襲24k

Python+大數據開發全國就業薪資情況

查看其他班級

9970元/月平均薪資

15900元/月最高薪資

100%就業率

58月薪過萬

  • 姓名
  • 性別
  • 就業時間
  • 就職城市
  • 就職企業
  • 薪資
  • 福利待遇
  • 姓名
  • 培訓前崗位
  • 培訓前薪資
  • 培訓后薪資
  • 入職時間
  • 入職公司
  • 就職城市

*學員就業信息統計數據為數據庫中實時調取的真實相關數據,非廣告宣傳

Python+大數據開發全國各校區就業喜報
和我們在線交談!

祁连县 调兵山市 同德县 扬州市 武胜县 皋兰县
鄯善县 霍邱县 哈密市 阿巴嘎旗 江孜县 略阳县
固始县 嘉定区 嘉禾县 商洛市 蓝田县 福泉市
泛站蜘蛛池模板: 金山区| 洪雅县| 财经| 淮南市| 郯城县| 千阳县| 黔西县| 泌阳县| 云林县| 奉化市| 张北县| 德格县| 宿州市| 门头沟区| 兴业县| 莱芜市| 云龙县| 永安市| 息烽县| 祁连县| 绥中县| 霍山县| 新昌县| 达州市| 阿拉尔市| 建昌县| 寿宁县| 新泰市| 泸西县| 高雄县| 嘉义市| 高碑店市| 安平县| 大田县| 徐汇区| 景宁| 麟游县| 增城市| 湖北省| 慈溪市| 清镇市|